OpenAI spúšťa pokročilú hlasovú funkciu pre používateľov ChatGPT!
Spoločnosť OpenAI v tomto týždni potešila používateľov ChatGPT sprístupnením pokročilej verzie modelu Advanced Voice, ktorý umožňuje konverzáciu s umelou inteligenciou v reálnom čase. Táto funkcia bola doposiaľ dostupná len niekoľkým tisícom používateľov. Odteraz je však s výnimkou niektorých regiónov aktívna celosvetovo a teší sa veľkej popularite.
Postupné sprístupňovanie vylepšenej funkcie Advanced Voice od 24. septembra zlepšuje možnosti interakcie s ChatGPT pre používateľov služieb ChatGPT Plus a Team.
Dlho očakávaná aktualizácia prináša aj päť nových hlasových profilov: Arbor, Maple, SXol, Spruce a Vale.
Tieto hlasové variécie rozširujú už existujúcu ponuku variantov ako Breeze, Juniper, Cove a Ember, ktoré boli dostupné aj v staršej verzii.
Okrem nových hlasov sa výrazne zlepšila aj schopnosť rozpoznávania reči, čo umožňuje modelu lepšie porozumieť rôznym prízvukom a hovorovým prejavom. V porovnaní so starou verziou model vie rozprávať v reálnom čase a nemá takmer žiadne omeškanie v reakciach.
Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) September 24, 2024
Používatelia si tiež budú mocž prispôsobiť svoj zážitok úpravou štýlu odpovedí, rýchlosti reči alebo výberom preferovaného regionálneho prízvuku, napríklad južanského.
Vylepšila sa aj pamäť systému, čo asistentovi umožňuje zapamätať si detaily z predchádzajúcich rozhovorov a poskytovať tak kontextovo bohatšie odpovede. Model si tak napríklad zapamätá vaše meno, ak mu ho prezradíte.
We’ve also improved conversational speed, smoothness, and accents in select foreign languages. pic.twitter.com/d3QOIBFCZb
— OpenAI (@OpenAI) September 24, 2024
Napriek týmto zmenám zatiaľ aktualizácia neobsahuje očakávanú multimodálnu funkciu, ktorá bola predstavená pred štyrmi mesiacmi. Tá by mala umožniť modelu spracovávať nielen text, ale aj obrazové a zvukové dáta, napríklad priamo z fotiek či videí.
Model tiež nemá prístup k internetu, čo znamená, že informácie v živom rozhovore čerpá len z toho, čo mu bolo známe do jesene 2023. Kedy OpenAI sprístupní Advanced Voice prístup k internetu nie je známe.
Sklamanie pre EÚ
Podľa vyjadrenia hovorcu OpenAI nie je nová funkcia zatiaľ dostupná v niektorých regiónoch, vrátane EÚ, Spojeného kráľovstva, Švajčiarska, Islandu, Nórska a Lichtenštajnska.
V EÚ je problémom podľa všetkého konflikt s reguláciou AI Act, ktorá zakazuje systémy, ktoré umožňujú analyzovať emócie u ľudí, čo je funkcia, ktorú Advanced Voice prináša. Je preto otázne, akým spôsobom OpenAI obíde toto nariadenie a či Voice Model v EÚ napokon bude sprístupnený, respektíve v akej forme.
Under a strict reading of the AI Act, ChatGPT advanced voice is *illegal* in EU workplaces and schools because the system can recognize a user’s emotions. That’s prohibited by the AI Act. https://t.co/w7697M4VBa pic.twitter.com/eDdJr7Y01U
— Dean W. Ball (@deanwball) September 24, 2024
Zdroje: Twitter, TechCrunch