Říjen se nesl hodně ve znamení open-source. Vedle nových modelů jsme se dočkali i posunu v „runtime“ pro vývojáře: místo jen rychlejších LLM vzniká ekosystém, kde modely běží uvnitř nástrojů, které denně používáte. A přestože schopnosti rostou, aktivní část modelů se dál zmenšuje (aktivní parametry v MoE), takže výkon už není jen o parametrech, ale hlavně o datech, tréninku a architektuře.
Apriel v1.5
Malý, ale silný open-source model od ServiceNow, který na Artificial Analysis Intelligence Index dosahuje ~52 bodů a je konkurenceschopný vůči výrazně větším modelům (DeepSeek R1 0528, Gemini-Flash apod.). Je hezkou ukázkou toho, že kvalita dat a techniky tréninku dnes často porazí hrubý počet parametrů.
Užitečné zdroje:
OpenAI Apps & Apps SDK
OpenAI představil „apps“ pro ChatGPT a Apps SDK. Prakticky jde o MCP servery, které poskytují vlastní UI přímo v ChatGPT. V praxi to znamená mnohem přívětivější integraci třetích stran přímo do GPT konverzací. S tím se pojí i vznik uplně nového, obrovského marketplacu na tvorbu aplikací, připočtu více jak 800 milion aktivních uživatelů.
Užitečné zdroje:
MiniMax M2
MiniMax zveřejnil M2, který si v žebříčku Artificial Analysis sáhl na nové maximum mezi ope-source modely (okolo 61 bodů) a přitom používá ~10 B aktivních parametrů (200 B celkem MoE). Aktuálně jde o nejchytřejší open-source model a pátý nejchytřejší model vůbec. M2 je navržen primárně pro agenty a kód.
Užitečné zdroje:
Cursor 2.0
Cursor 2.0 posouvá editor k agent-first přístupu: v Agents view spustíte až 8 agentů paralelně (klidně s různými modely), v jednom přehledu porovnáte jejich strategie a vyberete nejlepší výsledek. Díky git worktrees běží změny v izolovaných kopiích repa, takže můžete ve stejném projektu dál normálně kódovat bez kolizí; zároveň jsou návrhy jasně oddělené, což zlepšuje code review i audit. Součástí je i Composer 1, vlastní model Cursoru pro rychlé agentní smyčky (uváděná až 4× vyšší rychlost proti podobně schopným modelům). Prakticky to znamená míň slepých uliček, víc validních variant řešení a rychlejší iterace při refaktoringu i exploraci díky paralelní „orchestraci“ přístupů.
Užitečné zdroje:
Říjen hezky ukazuje, že počet parametrů už není všechno, stále víc rozhoduje kvalita dat, architektura a způsob trénování. Rozdíl mezi open- a closed-source se dál zmenšuje (pátý nejvýkonnější model je dokonce open source ), takže týmy mají víc manévrovacího prostoru optimalizovat cenu i deployment.
Zároveň klesá „aktivní“ velikost modelů, i když jejich schopnosti rostou: stále častěji jde o fragmentované MoE přístupy, kde se chytře zapínají jen potřebné expertní části. A nakonec to nejdůležitější: hodnota se přesouvá od honby za novými modely k integraci AI do reálného života, do IDE, chatu a interních nástrojů, kde lidem skutečně zrychluje práci a zvyšuje kvalitu výstupu
