Září přineslo spoustu releasů napříč Anthropic, Googlem, xAI i OpenAI. Většina z nich cílí hlavně na vývojáře. Pojďme se podívat, co novinky tentokrát přinesly.
Claude 4.5 Sonnet
Anthropic představil Sonnet 4.5, který výrazně posouvá autonomii a spolehlivost pro kódování a agentní scénáře. Ačkoli jde z hlediska výkonu spíše o střední model, v některých úlohách je silnější než například Claude 4 Opus. V interních i externích ukázkách zvládl samostatně pracovat desítky hodin (skok z ~7 h na ~30 h), přináší „context editing“ a nový memory nástroj v API pro delší běhy agentů bez ztráty důležitých informací. Současně s ním Anthropic vydal i Claude Code IDE Extension.
Co to znamená v praxi: méně halucinací, lepší následování instrukcí, stabilnější dlouhé tasky (např. refactoring větších částí kódu) a pohodlnější práci přímo v editoru díky oficiálním pluginům.
Užitečné zdroje:
Gemini 2.5 Flash & Flash-Lite
Google vydal preview hned dvou modelů. Jsou zajímavé především kvůli jejich rychlosti. Zvládají až 880 tokenů za vteřinu a to je obrovský posun, pro srovnání například Claude 4.5 Sonnet jich za stejný čas zvládne 70. Skvělé je, že cena je ale i při tomto výkonu pořád stejná a tak je model ideální například využít pro produkty, které jsou závislé na rychlém LLM výsledku nebo na svižném UX.
Užitečné zdroje:
Grok 4 Fast
xAI uvedlo Grok 4 Fast, reasoner optimalizovaný na efektivitu: v interních metrikách dosahuje výkonu srovnatelného se špičkovými modely, přitom typicky využije ~40 % méně „thinking“ tokenů. To se promítá do nižších nákladů při zachování kvality. Bude skvělé ho využít zejména tam, kde řešíte škálování nákladů za reasoning.
Užitečné zdroje:
GPT-5 Codex
OpenAI posouvá Codex, cloudového coding agenta, a přidává GPT-5-Codex jako specializovaný model. K tomu Codex CLI a IDE extension pro hlubší integraci do workflow. Jasně se zde ukazuje snaha OpenAI sjednotit celou řadu Codex napříč nástroji. Cílem je lepší integrace a vyšší použitelnost bez zbytečného přepínání kontextu.
Užitečné zdroje:
Gemini 3 už brzy
Možná už během října, nejdéle však začátkem prosince se dočkáme Gemini 3. Google zatím nepřišel s žádným oficiálním datem vydání. Můžeme to očekávat hlavně podle kroků Google z posledních let, kdy vždy vydával nové verze v průběhu Q4. (Gemini 1.0 v prosinci 2023 a Gemini 2.0 v prosinci 2024) Omezené preview by se ale mohlo objevit už v říjnu.
Obecně můžeme pozorovat, že se firmy zaměřují čím dál více na infrastrukturu kolem vývojářů a na integrace do vývojářských prostředí. Mezitím ale cena modelů i schopnosti foundation modelů zůstávají víceméně stabilní. Klíčová otázka je, jak zajistit, aby se uživatelé ptali správně a modely prokazovaly svou plnou hodnotu.