Ohromujúce, s ChatGPT sa už dá rozprávať v reálnom čase – Pozrite si prvé ukážky
Spoločnosť OpenAI sprístupnila niektorým platiacim používateľom pokročilý voice model pre konverzáciu s ChatGPT v reálnom čase.
Nový pokročilý Voice model v ChatGPT4o od firmy OpenAI sa zásadne odlišuje oproti pôvodnej bežne dostupnej možnosti konverzácie hlasom s ChatGPT. Tá je dostupná všetkým platiacim používateľom už viac než rok, no je špecifická pomalšími odpoveďami a častou chybosoťou.
Nový voice model, ktorý bol prvýkrát predstavený v máji, naopak umožňuje konverzáciu s ChatGPT v reálnom čase. To znamená, že model nečaká na otázku a negeneruje odpoveď niekoľko sekúnd. Konverzácia s ChatGPT tak pripomína konverzáciu s bežným človekom.
V máji ohúrili užívateľov najmä schopnosti tohto modelu asistovať napríklad pri preklade do cudzieho jazyku, čo demonštrovala Mira Murati z OpenAI s jej kolegami počas prezentácie tejto funkcie (viď. video dole).
Konverzačný model v reálnom čase mal byť pôvodne sprístupnený už pred letom, no OpenAI neskôr informovala, že najprv musia doladiť ešte niektoré nedokonalosti a termín spustenia odkladajú na druhú polovicu roka.
Od včerajšieho dňa sa však konečne dostal do rúk aj bežným používateľom. Respektíve niektorým „šťastlivcom” z tých, ktorí si platia platenú verziu ChatGPT. Z oficiálnej komunikácie OpenAI zároveň vyplýva, že do dvoch mesiacov by mala byť funkcia dostupná úplne všetkým, ktorí si za ChatGPT platia.
Prvotné reakcie sú veľmi pozitívne
Na sociálnej sieti X sa medzičasom objavilo niekoľko videí, ktoré demonštrujú používanie nového hlasového modelu tými užívateľmi, ktorí k nemu získali prednostný prístup.
Na prvom priloženom tweete môžete vidieť, ako GPT na pokyny užívateľa napodobňuje v reálnom čase hlasy Bugs Bunnyho, Yodu či Homera Simpsona.
ChatGPT Advanced Voice Mode doing a few impressions:
– Bugs Bunny
– Yoda
– Homer Simpson
– Yoda + Homer 😂 pic.twitter.com/zmSH8Rl8SN— Cristiano Giardina (@CrisGiardina) July 31, 2024
Ďalší tweet ukazuje, ako model hovorí na základe pokynu nadšene a po japonsky.
ChatGPT Advanced Voice Mode speaking Japanese (excitedly) pic.twitter.com/YDL2olQSN8
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Ďalší užívateľ otestoval reálnu schopnosť modelu prekladať zo švédčiny do angličtiny. Na prvý pohľad model fungoval bezchybne a v reálnom čase bez meškania a páuz.
Playing with @ChatGPTapp’s Advanced Voice Mode to create some Swedish-inspired tongue twisters 😊 pic.twitter.com/N4to9gdXE6
— Yana Welinder (@yanatweets) July 30, 2024
Užívateľ Manuel Sainsily zas ukázal, že model dokáže už pracovať aj s kamerou. Na kamere v smartphone nasnímal GameBoya v japončine a model mu pomohol v reálnom čase s prekladom do angličtiny.
Real-Time Japanese translation using #ChatGPT’s new advanced voice mode + vision alpha! Yet another useful example! pic.twitter.com/wDXrgYQkZE
— Manuel Sainsily (@ManuVision) July 31, 2024
Ďalšia úloha znela, počítaj od 1 do 10 extrémne rýchlo. A ešte rýchlejšie. A potom ešte rýchlejšie do 50. Takto to dopadlo.
ChatGPT Advanced Voice Mode counting as fast as it can to 10, then to 50 (this blew my mind – it stopped to catch its breath like a human would) pic.twitter.com/oZMCPO5RPh
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Ďalší pokyn znel, aby ChatGPT porozprával príbeh v casual indonesian, čiže v indonézštine. Dopadlo to zdá sa na jednotku.
ChatGPT Advanced Voice Mode telling a story in casual Indonesian pic.twitter.com/BWhf0XafBs
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Dôležité je, že model zjavne dokáže reagovať aj na prerušenia. To znamená, že keď mu skočíte do rečí, preruší vetu a počúva váš pokyn. To znamená, že model je naozaj schopný bežnej konverzácie a nemusíte uňho čakať, kým dokončí vetu alebo predošlú úlohu.
#Chatgpt low latency + interruption Voice is awesome. I'll be relearning Cantonese soon to make mom happy!
OpenAI is helping all relearn so much, at any speed, anyway, super fun, and in my pocket!
This will be my engine for google home, phone, glasses, couch, fridge, car, etc! pic.twitter.com/n39gcw6Zks
— Aaron (Tango) Tang (@hahatango) July 31, 2024
No a mimochodom, pokúša sa aj o beatboxing. Nie je to úplne zlé.
Yo ChatGPT Advanced Voice beatboxes pic.twitter.com/yYgXzHRhkS
— Ethan Sutin (@EthanSutin) July 30, 2024
Záver
Model je zatiaľ dostupný na testovanie len zhruba 24 hodín a len obmedzenej niekoľkotisícovej vzorke platiacich užívateľov. Na finálny verdikt je teda priskoro, no už prvé zábery naznačujú, že pôjde o prelomový produkt, ktorý môže používanie umelej inteligencie v bežnom živote posunúť na nový level.
My sme sa žiaľ medzi testovaciu vzorku nedostali a tak musíme čakať, kým si vytvoríme definitívny názor. Každopádne sledujte náš magazín Futuremag naďalej, o ďalšom vývoji vás budeme okamžite informovať.
Zdroje: X, OpenAI