Novinky Umelá inteligencia

OpenAI má za sebou DevDay. Predstavila niekoľko veľkých noviniek

OpenAI Dev Day

Spoločnosť OpenAI predstavila na vývojárskej konferencii v San Franciscu významné aktualizácie svojho API rozhrania, ktoré podporia vývoj sofistikovanejších aplikácií založených na umelej inteligencii.

Cieľom je pritiahnuť pozornosť vývojárov a ukázať výhody svojej API platformy, ktorá si už získala vyše 3 milióny používateľov. V snahe zvýšiť atraktivitu výrazne znížila náklady na jej využívanie, čím sa priblížila konkurentom, ako sú Meta a Google.

Destilácia modelov

Jednou z hlavných noviniek je metóda destilácie modelov, ktorá zlepšuje výkon menších jazykových modelov, ako je napríklad GPT-4o mini.

Táto technika umožňuje menším modelom učiť sa z výstupov väčších modelov, čím dosahujú vyššiu kvalitu a relevanciu generovaných textov.

Optimalizácia nákladov na API

Aby vývojári mohli efektívnejšie využívať svoje zdroje, OpenAI zaviedla funkciu ukladania výziev do vyrovnávacej pamäte.

Táto funkcia umožňuje uloženie dlhých predpon, ktoré sa často používajú na usmernenie odpovedí modelov, a pri opakovanom použití týchto predpon poskytuje zľavu. Konkurenčná spoločnosť Anthropic pritom oznámila podobnú funkciu už v auguste.

Rozšírené možnosti vnímania

Model GPT-4o teraz lepšie zvláda interakciu s vonkajším prostredím, čo je užitočné pre aplikácie vo vizuálnom vyhľadávaní, detekcii objektov v autonómnych vozidlách, inteligentných mestách alebo pri presnej analýze lekárskych snímok.

Napríklad startup Coframe využil tieto schopnosti na vylepšenie asistenta, ktorý generuje kód pre webové stránky.

Multimodálnosť a Realtime API

OpenAI tiež výrazne zjednodušila proces vývoja multimodálnych aplikácií. Predtým bolo potrebné prepisovať zvuk, odovzdávať text z prepisu modelu a následne prevádzať výstup späť na reč. Vďaka API rozhraniu RealtimeAPI sa zvuk okamžite bez potreby integrácie viacerých aplikácií, čím sa výrazne urýchľuje celý proces.

API podporuje aj volacie funkcie, čo umožňuje vývojárom vytvárať aplikácie, ktoré môžu napríklad objednať pizzu alebo naplánovať stretnutie.

OpenAI plánuje, že Realtime API bude čoskoro podporovať multimodálne zážitky vrátane videa.

Zdroje: Inc