OpenAI opäť chystá nový model umelej inteligencie – Kedy príde o3?
Model ChatGPT o1 ešte ani poriadne nevychladol, a jeho tvorca už chystá nový. Popri množstve iných noviniek oznámila spoločnosť OpenAI vývoj nového modelu s označením o3. Tento prelomový systém má priniesť výrazné zlepšenie v oblasti strojového uvažovania a riešenia komplexných problémov.
Podľa portálu The Verge si však naň ešte nejaký čas počkáme. Podobne ako v prípade modelu o1 by však mal byť dostupný vo verziách o3 a o3-mini.
Bezprecedentné výsledky v testoch
Podľa prezentácie sa však už teraz môžeme tešiť na veľmi pôsobivé výsledky. Nový model o3 údajne prekonáva všetky doterajšie výkony v rôznych oblastiach.
Podobne ako v prípade o1 ide o model fungujúci na princípe tzv. uvažovania. V kontexte umelej inteligencie to v podstate znamená postupné riešenie problému s opísaním postupu riešenia.
V programátorských testoch SWE-Bench Verified dosahuje o 22,8 % lepšie výsledky než predchádzajúce verzie. Pozoruhodný je jeho výkon v matematike, kde takmer dokonale zvládol náročnú súťaž AIME 2024. V expertných vedeckých úlohách GPQA Diamond dosiahol úspešnosť 87,7 %.
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI) December 20, 2024
Bezpečnosť na prvom mieste
OpenAI chce pri uvedení tohto nového modelu položiť dôraz na jeho bezpečné nasadenie. Spoločnosť zatiaľ neurčila dátum jeho verejného spustenia a najprv umožní testovanie vybraným výskumníkom.
Pri vyhodnocovaní toho, či požiadavka zadaná používateľom spĺňa zadefinované bezpečnostné kritériá, a teda či model môže pristúpiť k jej riešeniu, sa využíva komplexnejší systematický prístup. V rámci neho model vyhodnocuje kritériá čiastkovo a aj v tomto procese využíva tzv. uvažovanie, ako sme si ho opísali vyššie.
Zaujímavosťou je, že firma po uvedení modelu o1 prešla hneď na model o3. Zámerne pritom vynechala označenie o2, aby predišla zámene s názvom známej britskej telekomunikačnej spoločnosti.
Zdroj: The Verge