Listopadové AI novinky

Délka:

6 min

Publikováno:

3. prosince 2025

Listopad patřil frontier modelům a agentním nástrojům pro vývojáře. Nejde už o vyšší skóre v benchmarcích. Jde o to, jak dobře model zvládne reálnou práci v repozitáři, dlouhou konverzaci a automatizovaný workflow.

Claude Opus 4.5

Claude Opus 4.5 je zatím nejvýkonnější model od Anthropic. Výrazně se zlepšil v kódování, práci s autonomními agenty, analýze dat, tabulkách i přípravě prezentací. Spolehlivě zvládne vícekrokový workflow, dlouhý kontext i složité úlohy, a přitom spotřebuje míň tokenů, takže pracuje úsporněji. To z něj dělá dobrou volbu pro nasazení ve firmě, automatizaci procesů i rozsáhlé agentní scénáře.

Užitečné zdroje: Claude Opus 4.5

Gemini 3 Pro

Gemini 3 Pro je první model, o kterém můžeme říct, že posouvá laťku skoro ve všech benchmarcích. V Artificial Analysis Indexu se drží nad GPT-5.1, podle některých zdrojů zhruba o tři body. Na ARC-AGI 2 zdvojnásobil dosavadní nejlepší výsledek. Podle některých zdrojů jde o opravdu obrovský model, asi 2–3x větší než ostatní proprietární modely. Ukazuje, že škálování pořád funguje, jen ho je čím dál těžší dosáhnout.

Užitečné zdroje: Gemini 3 Pro

OpenAI GPT-5.1

OpenAI vydalo nový model GPT-5.1. Hlavní posun je v rychlosti a efektivitě běhu, samotná inteligence se naopak změnila jen málo. Model nabízí dva režimy: Instant pro rychlé odpovědi a Thinking pro náročnější úlohy, kde se vyplatí delší přemýšlení. K dispozici je v několika velikostech, od Mini po Pro. Novinkou je výrazně větší kontextové okno, takže s rozsáhlejší kódovou bází nebo dokumentací zvládnete pracovat v jednom záběru.

Užitečné zdroje: OpenAI: přehled GPT-5.1 a režimů Instant / Thinking

OpenAI GPT-5.1 Codex Max

GPT-5.1-Codex-Max je nový frontier model od OpenAI zaměřený čistě na programování a agentní práci. Kombinuje chain-of-thought, tedy generování mezikroků uvažování, s technikou context-compaction. Díky tomu utáhne dlouhé a projektově rozsáhlé úlohy, jako jsou refaktoringy, rozsáhlé debugování nebo generování složitých systémů, aniž by se přetížilo kontextové okno.

Užitečné zdroje: OpenAI 5.1 Codex Max

Moonshot Kimi K2

Kimi K2 je open-source model s bilionem parametrů, z nichž se při inferenci aktivuje zhruba 32 miliard. Sedne týmům, které chtějí mít kontrolu nad svými daty a zároveň potřebují špičkový výkon v agentních a automatizačních úlohách. Kvůli velikosti ale potřebuje robustní infrastrukturu. Provoz běžně znamená několik GPU, například high-end karty nebo specializované clustery, protože plný chod si žádá hodně paměti, VRAM a výpočetního výkonu.

Užitečné zdroje: Moonshot Kimi K2

Grok 4.1

Grok 4.1 dobře pracuje s emocemi a mezilidským kontextem. Varianta Fast zvládne až 2 miliony tokenů, takže unese velkou kódovou bázi nebo dlouhou konverzaci. Díky Agent Tools API se hodí pro produkční agenty a náročný tool-calling. Objevil se ale problém s přehnaným chválením Muska a výrazným zaujetím, což naznačuje možný bias. U citlivých témat, jako je historie, politika nebo ověřená fakta, proto jeho odpovědi nemusí být dostatečně neutrální ani spolehlivé.

Užitečné zdroje: Grok 4.1, TechCrunch

Google Antigravity

Antigravity je nové agent-first IDE od Googlu postavené kolem Gemini 3 Pro. V praxi jde o vývojové prostředí, kde mají agenti přímý přístup do editoru, terminálu i prohlížeče, takže si dokážou kód sami napsat, spustit i ověřit. Hned po vydání ale někteří uživatelé hlásili nedostupnost modelu kvůli velkému zatížení. Objevily se i vážné bezpečnostní zranitelnosti: při výchozím nastavení můžou agenti číst citlivé soubory a spouštět libovolné příkazy.

Užitečné zdroje: Google Antigravity, Techradar

Listopad hezky ukazuje, že nejde o co největší a nejchytřejší model, ale o to, jak dobře sedne na konkrétní práci a stack týmu. Specializované modely na kód, rychlé malé modely i silné open-source alternativy dávají mnohem víc prostoru ladit výkon, cenu a kontrolu nad daty. A čím dál víc platí, že skutečná hodnota vzniká ve chvíli, kdy AI dobře napojíte do IDE, chatu a interních nástrojů, kde reálně zrychluje vývoj.

Související články

Pokud vás zajímají další AI novinky a trendy:

Říjnové AI novinky – nový měsíc je tady a s ním i říjnové AI novinky.
Zářijové AI novinky – jako vždy zde najdete výběr toho nejpodstatnějšího ze světa umělé inteligence.
AI: Pomocník nebo hrozba pro juniory? – AI ve vývoji očima juniora.
Jak začít s GitHub Copilot? – GitHub Copilot krok za krokem.

Zpět na postřehy

Chcete být o krok napřed?

Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.