OpenAI predstavila model o1 – patrí teraz ChatGPT “do koša”?

Už niekoľko týždňov sa špekulovalo, kedy spoločnosť OpenAI príde s oznámením svojej novej ešte pokročilejšej umelej inteligencie (AI). Stalo sa tak vo štvrtok večer.

OpenAI, tvorca najznámejšieho AI chatbota ChatGPT, odhalil vo štvrtok projekt s názvom „o1″. Ide o skutočné pomenovanie toho, o čom sa predtým špekulovalo v médiách ako o “projekte Q” či projekte “Strawberry”.

Skvelou správou je, že o1 je možné, hoci s určitým obmedzeniami, okamžite aj používať. Prístup k verziám o1-preview a o1-mini majú platiaci používatelia ChatGPT Pro a Teams.

Poďme si v tomto článku vysvetliť, čo to „o1″ vlastne je a ako zmení náš svet.

Ako sa o1 odlišuje od ChatGPT?

OpenAI vysvetľuje, že nová séria LLM modelov, ktorá bude zrejme odteraz označovaná vždy začiatočným písmenom “o” je navrhnutá tak, aby si pred odpoveďou dôkladnejšie premyslela odpovede. To znamená, že modely “o“ síce premýšľajú o čosi dlhšie, no sú schopné dopracovať sa ku presnejšej odpovedi.

Modely “o” vďaka tomuto dokážu zvládnuť náročnejšie problémy, než predchádzajúce modely. Dominujú tak najmä v oblastiach ako je veda, programovanie a matematika.

Ako to funguje?

Modely z novej “produktovej série” OpenAI boli vytrénované tak, aby pred odpoveďou strávili viac času premýšľaním nad problémom, podobne ako by to robil človek. Počas tréningu sa samy učia zdokonaľovať svoj proces myslenia, skúšať rôzne stratégie a rozpoznávať svoje chyby, vysvetľuje OpenAI.

Pri testoch dosiahol model “o1” podobné výsledky ako doktorandi na náročných referenčných úlohách vo fyzike, chémii a biológii.

,,Model sa tiež výborne osvedčil v matematike a programovaní. V kvalifikačnom teste pre Medzinárodnú matematickú olympiádu (IMO) správne vyriešil 83 % úloh, zatiaľ čo GPT-4o iba 13 %,” chváli OpenAI obrovskú úspešnosť modelu o1 v jednom z náročných testov.

,,Jeho schopnosti v programovaní boli hodnotené v rôznych súťažiach, pričom 89. percentil dosiahol v Codeforces súťažiach,” dopĺňa.

Firma OpenAI zdôrazňuje, o1 môže byť využitý zdravotníckymi výskumníkmi na anotáciu dát sekvenovania buniek, fyzikmi na generovanie zložitých matematických vzorcov potrebných pre kvantovú optiku a vývojármi vo všetkých oblastiach na vytváranie a vykonávanie viacstupňových pracovných postupov.

Príklad komplikovanej úlohy

Na prezenčnom videu OpenAI napríklad ukázala, ako model o1-preview rieši komplikovanú slovnú úlohu so zadaním:

,,Princezná je tak stará, ako bude princ, keď bude princezná dvakrát tak stará, ako bol princ, keď bol vek princeznej polovicou súčtu ich súčasného veku. Aký je vek princa a princeznej? Poskytnite všetky riešenia tejto otázky.”

What's different about OpenAI o1 is that it "thinks" to produce an internal chain-of-thought before responding to the user

If you use ChatGPT, you know that long threads giving more context improve responses, so this is basically what they're doing, but from one prompt pic.twitter.com/ctgxEJp8jU

— Rowan Cheung (@rowancheung) September 12, 2024

Kým model ChatGPT4o nedokázal odpovedať správne, o1-preview to zvládol, pretože použil iný postup uvažovania.

Hodnotenie modelov

OpenAI tiež zverejnila porovnávacie hodnotenie modelov “GPT4o” a „o1“ v rámci rôznych testov, ktoré sa používajú na vyhodnocovanie úspešnosti LLM modelov. Výsledky môžete vidieť na nasledujúcom obrázku. Nižšie si ich bližšie popíšeme.

V porovnaní výkonnosti modelov umelej inteligencie GPT-4o a o1 sa ukázalo, že model o1 čiastočne alebo výrazne prekonáva GPT-4o v rôznych testoch a hodnoteniach, ktoré sa týkali týchto sledovaných oblastí:

Matematika
Chémia
Fyzika
Biológia
Angličtina
Anglická literatúra
Právo
Čítanie a písanie

Model o1 exceluje najmä v matematických a vedeckých úlohách, kde dosahuje vyššiu presnosť a lepšie výsledky.

Napríklad v testoch ako MATH-500 a PhD-level otázkach z fyziky a chémie dosiahol o1 výrazne lepšie skóre.

Okrem toho, o1 prekonáva GPT-4o aj v jazykových a právnych testoch, čo naznačuje jeho širšie schopnosti a efektívnosť v rôznych oblastiach.

Tieto výsledky naznačujú, že o1 je vhodnejší pre aplikácie, ktoré vyžadujú hlboké porozumenie a presnosť, čím sa stáva preferovanou voľbou pre náročné úlohy.

V čom je “horší” než ChatGPT?

Z testov vyplýva, že na náročné úlohy je o1 model rozhodne vhodnejší, než GPT4o. Najmä ak ide o logické veci, programovanie či vedné odbory.

Nie vo všetkom je však lepší než súčasný ChatGPT4o. Ten napríklad vie surfovať po internete a pracovať s uploadnutými obrázkami či inými formátmi súborov – napríklad PDF. Toto zatiaľ nový model nedokáže.

Pre užívateľa však nie je zložité si medzi modelmi vybrať, ktorý je preňho vhodnejší na konkrétnu úlohu.

Čo je OpenAI o1-mini?

OpenAI okrem o1-preview (testovacia verzia veľkého modelu) sprístupnila aj model o1-mini. Ten je vlastne akousi mini verziou väčšieho modelu, podobne ako ChatGPT4o-mini je menšou verziou ChatGPT4o.

Tieto menšie verzie sú rýchlejšie, čiže dokážu generovať odpovede rýchlejším spôsobom, no nie sú až také “dokonalé” a presné.

OpenAI vysvetľuje, že menší model je o1-mini o 80 % lacnejší ako väčší model o1-preview, “čo z neho robí výkonný a nákladovo efektívny model pre aplikácie, ktoré vyžadujú uvažovanie, ale nie široké znalosti sveta.”

Ako sa dostáť k modelom a aké majú limity?

Dostať sa k modelom o1-preview a o1-mini sa môže každý platiaci používateľ ChatGPT, či už ide o službu Pro alebo Teams. Stačí, aby v hornom menu prepol z modelu GPT4o na model “o1-preview” alebo model “o1-mini”.

Tieto nové modely však zatiaľ majú svoje limity.

,,Na začiatku budú týždenné limity 30 správ pre o1-preview a 50 pre o1-mini. Pracujeme na zvýšení týchto limitov a umožnení, aby si ChatGPT automaticky vybral správny model pre daný vstup,” vysvetlila OpenAI.

Čo bude ďalej?

OpenAI vysvetlila, že súčasné modely, ktoré sú k dispozícii, sú len akousi štartovacou čiarou. Budúce modely budú disponovať možnosťou prehľadávať internetové stránky, nahrávať súbory, analyzovať obrázky a robiť prakticky všetko čo, čo ponúka model GPT4-o.

OpenAI však tiež vysvetlila, že modely o1 tvoria novú produktovú líniu, ktorá je viac zameraná na presnosť a odbornosť.

Línia GPT bude pokračovať aj naďalej, pretože GPTs sú v mnohých prípadoch efektívnejšie a vhodnejšie na jednoduchšie formáty. To pravdepodobne znamená, že GPT4o skôr či neskôr nahradí GPT5.

Zdroj: X, openai.com