Další měsíc je za námi a s ním i další várka novinek ze světa umělé inteligence. Jako obvykle to bylo nabité – nové modely, nové architektury, rekordní kontextová okna a důraz na rychlost a cenu.
Vybírali jsme pečlivě a zaměřili se na to, co podle nás nejvíc posouvá AI vpřed.
Release Llama 4
Meta vydala Llamu 4, novou řadu open-weight jazykových modelů, která přináší dvě zásadní novinky:
- Přechod na MoE (Mixture of Experts) architekturu, která při každém dotazu aktivuje jen malou část modelu - konkrétní “experty”. Výsledkem je vyšší rychlost i nižší náklady.
- Tři různé modely: Nejrychlejší Scout, Maverick s milionovým context window a největší Behemoth, který je dosud ve fázi trénování.
- Varianta Scout umožňuje kontextové okno až 10 milionů tokenů, což je extrémní posun oproti běžně dostupným modelům. Velmi velké context window je zatím spíše teoretická možnost – modely zatím nejsou schopny „vybavit“ si všechny kontextuální informace v tomto rozsahu.
- Užitečné zdroje:
Release GPT-4.1 modelů
OpenAI přichází s novou iterací svého hlavního modelu: GPT-4.1. Tato verze je:
- primárně dostupná přes API
- Tři různé modely (4.1, rychlejší a slabší Mini a nejrychlejší Nano)
- levnější než GPT-4o, ale zároveň o něco pomalejší – bottleneckem je rychlost odezvy
- schopná zvládat až jeden milion tokenů
- výrazně lepší v následování instrukcí
Model velmi dobře pracuje s dlouhými texty a s jejich kontextem. Spolu s GPT-4.1 OpenAI představila nový benchmark pro MRCR (Multi-round Co-reference Resolution). Nový tier GPT-4.1 Nano je aktuálně ze všech nejrychlejší, ale zároveň nejméně výkonný.
OpenAI uvádí multimodální modely o3 a o4-mini
Jde zatím o nejpokročilejší reasoningové modely. Oba jsou dostupné pro platící uživatele a dají se použít skrze API.
- o3 dosahuje “state of the art” výsledků na opravdu složitých benchmarcích, jako je Codeforces nebo SWE-bench
- o4-mini je menší, ale rychlejší reasoningový model
- Oba modely jsou specificky trénované na využívání nástrojů (function calling), což naznačuje jejich možné využití v inteligentních agentech.
- Užitečné zdroje:
Gemini 2.5 Pro si vede dobře
Modely od Googlu si získávají stále více uživatelů – především díky skvělému poměru ceny, výkonu a rychlosti.
Gemini 2.5 Pro je aktuálně nejvýkonnější model od Googlu a zatím je dostupný zdarma pro všechny uživatele.
OpenAI uvažoval o koupi Windsurf IDE
V minulém týdnu začalo OpenAI mluvit o koupi Windsurfu - konkurence Cursoru. OpenAI nabídlo zaplatit tři miliardy dolarů, což jednak ukazuje, jakou hodnotu mají a budou mít AI nástroje pro vývoj, ale hlavně jejich dlouhodobý záměr zaměřit se na end-user produkty.
- Užitečné zdroje:
Vývoj v AI jede naplno a novinek přibývá každým týdnem. Sledujeme to za vás a i v dalších měsících přineseme to nejzajímavější.
Author

Jakub Vacek
Software AI EngineerJsem senior backend vývojář se zaměřením na mikroservisní architekturu a v poslední době také na využití AI. Ovládám TypeScript, Node.js, React.js, Nest.js a práci s AI.