OpenAI sprístupní real-time hlasového asistenta ChatGPT-4o
Generány riaditeľ OpenAI, firmy, ktorá stojí za ChatGPT, Sam Altman, oznámil, že od budúceho týždňa sprístupnia predplatiteľom služby ChatGPT Plus obmedzenú „real-time“ alfa verziu hlasového režimu pre svoj najnovší jazykový model GPT-4o.
Táto novinka prináša významné rozšírenie komunikačných možností platformy, ktoré boli doteraz obmedzené. Sam Altman to potvrdil v odpovedi na otázku na sociálnej sieti X.
Sam Altman confirms that ChatGPT Voice Mode alpha starts this month
General rollout will be "a bit after": pic.twitter.com/RURlgYCSUJ
— Kol Tregaskes (@koltregaskes) July 18, 2024
Aktuálne má hlasová funkcia v ChatGPT, dostupná pre bezplatných aj platených používateľov, značné latencie: 2,8 sekundy pre GPT-3.5 a 5,4 sekundy pre GPT-4. Oneskorenie vyplýva z používania troch samostatných modelov na prepis zvuku na text, spracovanie textu a prevod textu späť na zvuk.
Tento viacstupňový proces negatívne ovplyvňuje kvalitu interakcie a vedie k strate významného množstva informácií, vysvetľuje OpenAI.
Nový model bude však schopný komunikovať v real-time. Inak povedané ChatGPT4o by mal byť schopný, ako to demonštrovali aj ukážky, odpovedať na otázky okamžite ako pri konverzácii s bežným človekom.
VIDEO: Rozhovor s ChatGPT4o v reálnom čase počas prezentácie OpenAI
Jednotná neurónová sieť modelu GPT-4o umožňuje efektívnejšie spracovanie multimodálnych dát, čo vedie k zlepšeniu koherentnosti generovaného textu. Okrem toho model vykazuje vylepšené schopnosti v oblasti porozumenia kontextu, generovania rôznorodých odpovedí a adaptácie na rôzne štýly komunikácie.
Od svojho uvedenia spoločnosť OpenAI aktívne promuje hlasový režim ChatGPT prostredníctvom rôznych videí a ukážok. Prezentácie zdôrazňujú schopnosť modelu improvizovať v rôznych hlasoch a rolách, asistovať pri jazykovom vzdelávaní a podporovať interaktívne formy učenia. GPT-4o tiež lepšie zvláda prerušovania, riadi skupinové konverzácie, filtruje hluk na pozadí a prispôsobuje sa tónu.
Zatiaľ sa nevie, či model s real-time schopnosťou konverzácie skrz hlas bude sprístupnený všetkým platiacim zákazníkom, alebo len obmedzenej vzorke. Skôr sa očakáva, že podobne ako vyhľadávanie SearchGPT, ktoré bolo predstavené tiež tento týždeň, sprístupní OpenAI tento model najprv na testovanie len niektorým vybraným používateľom.
I get it.
We're all extremely frustrated waiting for OpenAI.
They spoke of Voice mode rolling out almost 2 months ago.
So while we wait, here is a fantastic demo:
Romain Huet, Head of Developer Experience at OpenAI showcased GPT-4o's visual abilities.
ChatGPT was able to… pic.twitter.com/KybiTDW30d
— Alex Banks (@thealexbanks) July 23, 2024
Zdroje: business-standard, Twitter