
Věděli jste o tom, že Netflix má obrovský tým výzkumníků a že z toho na co se na Netflixu díváte, je ovlivněno jejich systémem pro doporučování titulů? Zajímalo vás někdy jak doporučování funguje?
Doporučení, která vidíte jsou výsledek výkonných doporučovacích modelů. Původně každá sekce - např. “Pokračovat v přehrávání” a “Příště si nenechte ujít” měla svůj model, který sice bral data ze stejných zdrojů jako ostatní ale každý model byl trénovaný separátně. Údržba a vylepšování individuálních modelů se stávala čím dál náročnější a dražší.
Netflix se letos začíná posouvat k jednotnému a ucelenému systému – staví výkonný foundation model (základní model), který rozumí uživatelskému chování a preferencím a dokáže tato data sdílet napříč všemi doporučovacími systémy.
Z mnoha modelů jeden supermodel 👀
Původně měl Netflix spoustu menších modelů, každý trénovaný samostatně. Jeden si například pamatoval, co máte rádi v rámci akčních filmů, jiný zas doporučoval pořady, které jsou zrovna populární. Modely spolu ale nekomunikovaly. To způsobovalo problémy především při aktualizacích a když bylo třeba modely vylepšovat.
Nový přístup Netflixu je inspirován fungováním (= large language models, zkráceně LLMs). Místo budování spousty malých modelů teď staví jeden velký, který chápe vaše sledovací návyky jako celek. Tento model pak může pomáhat ostatním systémům tím, že sdílí, co se naučil — buď přímo, nebo skrze opakovaně použitelné .
Tokenizace = Přeměna sledovacích návyků na tokeny
Netflix je profesionální stalker. Sleduje každou vaši interakci: co sledujete, jak dlouho, co přeskočíte, dokonce i na jakém zařízení a v jakém jazyce. Jen surová (unlabeled) data sama o sobě ale nestačí. Netflix proto tyto (inter)akce převádí na (tokens) — jednotky chování, jako např. „Sledoval Stranger Things 40 minut na telefonu večer“.
Model je krmen těmito tokeny, aby se naučil, jak se uživatelé chovají v čase. Zde nastává další výzva - uživatelé dělají spoustu věcí. Netflix proto musí najít způsob jak rozhodovat, kolik detailů si zachová, ale zároveň musí zařídit, aby se data zpracovávala rychle.
Model se učí jako člověk, ne jen jako stroj
Jak už jsme zmínili, Netflix se inspiroval u LLMs, které předpovídají další slovo neboli token. Netflix chce ale předpovídat další akci, kterou by uživatel mohl udělat. Akcí je ale spousta a tak jim musí přikládat různou váhu - sledování celého filmu má například větší váhu a význam než když se podíváte na trailer, který má 3 minuty. Model se tedy učí vnímat, co je důležité a to mu umožňuje lépe doporučovat pořady, které by se vám mohly líbit.



