ChatGPT a emócie: Pozrite sa, čo dokáže pokročilý hlasový režim!
Schopnosti chatbotov umelej inteligencie sa neustále rozširujú: poskytujú presnejšie informácie, vedia pracovať s obrázkami a inými druhmi súborov a v poslednej dobe sledujeme pokrok v hlasovej komunikácii.
Jedným z pretrvávajúcich nedostatkov hlasovej komunikácie s umelou inteligenciou bola okrem latencie (oneskorenia) aj akási mechanickosť, neschopnosť vyjadriť emócie. V pokročilom hlasovom režime (Advanced Voice) ChatGPT, ktorý OpenAI nedávno sprístupnila vybraným používateľom, je tento problém minulosťou.
Pozrite si, ako ChatGPT Advanced Voice dokáže vyjadrovať emócie
Do ChatGPT stačí teraz zadať kontext situácie a vysvetliť mu, akým spôsobom má rozprávať, a on sa dokáže do tejto roly „vžiť“. Vie vyjadriť hnev, smútok, šťastie či strach.
To otvára nové možnosti v rôznych oblastiach, napríklad pri dabovaní videí. V nasledujúcich ukážkach na sociálnej sieti X si môžete pozrieť, ako to funguje vo videách vytvorených umelou inteligenciou. Ukážka obsahuje šesť videí, z ktorých každé je zamerané na inú emóciu.
ChatGPT Advanced Voice: Unleash the Power of Emotion in AI Voice
Sound on 🔊
The biggest challenges with AI voices has always been the lack of emotion control.
But with ChatGPT Advanced Voice, that’s no longer an issue. Just provide the context of your story, and it can… pic.twitter.com/EldwwvvWDf
— el.cine (@EHuanglu) September 30, 2024
Vývoj napreduje
V ukážkach vidíme, že kombinácia videa vytvoreného umelou inteligenciou a hlasu z ChatGPT Advanced Voice nie vždy úplne pasuje. Napríklad žena, ktorá sa práve dozvedela, že jej syn umrel vo vojne, reaguje so žiaľom, ale v niektorých momentoch vyzerá, akoby sa išla rozosmiať. Aj na iných videách obraz nie vždy úplne ladí s požadovanými emóciami.
2/6 ChatGPT Advanced Voice Test: Sadness
Situation: A woman receives the news that her son has passed away in the war.
Voice: The woman’s voice should crack, be barely audible at times, with long pauses between words as they struggle to speak. pic.twitter.com/wL3KgfarVt
— el.cine (@EHuanglu) September 30, 2024
Keď však dáme video bokom a započúvame sa do samotného hlasu, výsledok je oveľa lepší a pôsobí autentickejšie. To už teraz poskytuje veľmi sľubné možnosti dabovania reálne natočených videí.
Zároveň je to aj v kombinácii s videami vytvorenými AI veľký pokrok a je zrejme len otázkou času, kedy budú aj takto vytvorené videá vyzerať lepšie a autentickejšie.
Zdroj: X