ChatGPT4o má ďalšiu konkurenciu – prekonáva ho čínsky model SenseNova
Na Svetovej konferencii o umelej inteligencii predstavila čínska spoločnosť SenseTime svoje nové multimodálne AI modely SenseNova 5o a vylepšený jazykový model SenseNova 5.5.
Prvý čínsky multimodálny model v reálnom čase
Čínska spoločnosť SenseTime, známa svojimi pokrokmi v oblasti umelej inteligencie, predstavila na Svetovej konferencii o umelej inteligencii v Šanghaji (WAIC) svoj nový multimodálny AI model SenseNova 5o.
Tento model je prvým čínskym multimodálnym modelom, ktorý dokáže poskytovať interakciu v reálnom čase na úrovni porovnateľnej s ChatGPT-4o od OpenAI.
SenseNova 5o dokáže spracovávať audio, text, obraz a video dáta, čo umožňuje používateľom komunikovať s modelom jednoduchým hovorením.
SenseTime v rámci prezentácie predviedla aj demo, ktoré ukázalo schopnosti modelu rozpoznávať a popisovať jednotlivé objekty pomocou kamery smartfónu, čím pripomenula nedávnu prezentáciu OpenAI a jej GPT4o.
Tento model je obzvlášť vhodný pre reálne konverzácie, čo otvára nové možnosti pre interakciu medzi ľuďmi a AI.
Tweet s videom: Prezentácia modelu preložená do angličtiny
SenseTime 5o demo translated to English.
While the naming is reminiscent of GPT-4o, and the speed is indeed impressive, I didn't see any interruptions, they wait until the bot finishes, and I don't know if this is omnimodal or STT->LLM->TTS pipeline 🤔 https://t.co/6nycW2gzFX pic.twitter.com/DUnPzjGj3Z
— Alex Volkov (Thursd/AI) (@altryne) July 8, 2024
Vylepšený jazykový model SenseNova 5.5
Okrem multimodálneho modelu SenseNova 5o predstavila spoločnosť aj vylepšenú verziu svojho jazykového modelu SenseNova 5.5.
Podľa SenseTime dosahuje táto verzia o 30 percent vyšší výkon v porovnaní s predchádzajúcou verziou 5.0, ktorá bola uvedená len pred dvoma mesiacmi.
Tréningové dáta zahŕňali viac ako desať terabajtov vysokokvalitných údajov, vrátane mnohých synteticky generovaných reťazcov na zlepšenie schopností modelu v oblasti logického uvažovania.
SenseNova 5.5 prináša významné zlepšenia v matematickom uvažovaní (+31,5 %), angličtine (+53,8 %) a v schopnosti nasledovať pokyny (+26,8 %).
Tieto vylepšenia posúvajú interaktivitu a mnohé kľúčové ukazovatele na úroveň porovnateľnú s GPT-4o.
V čom prekonal ChatgPT4o?
Firma Sensetime zverejnila na podujatí aj infografiku s 8 hodnotiacimi kritériami, pričom podľa jej vyhodnotenia sa ich chatbot SenseNova 5.5 ocitol na prvom mieste s finálnym skóre 69.9 bodov.
Na druhom mieste skončil ChatGPT4o od OpenAI s rovnakým hodnotením 69.9 bodu, no s horšími výsledkami v piatich z 8 hodnotiacich kritérií.
Tesne tretí skončil nedávno predstavený Claude 3.5 Sonnet od spoločnosti Anthropic.
SenseTime 5.5 prekonal GPT-4 v kategóriách MMB v1.1, MMStar, MathVista, AI2D a OCRBench, čo znamená, že lepšie rozumie a generuje text na základe multimediálnych vstupov, rieši matematické úlohy, rozpoznáva text a analyzuje obrázky.
Naopak, GPT-4o bol lepší v kategóriách MMMU, HallusionBench Avg. a MMVet, čo naznačuje jeho lepšie schopnosti v multimodálnom porozumení, zvládaní halucinácií a v schopnosti vizuálneho porozumenia a spracovania rôznych typov vizuálnych údajov.
Budúcnosť AI modelov a investície do edge-based riešení
SenseTime sa tiež zameriava na vývoj jazykových modelov pre edge-based riešenia, ktoré sú rýchle a nákladovo efektívne. S modelom SenseChat Lite-5.5 sa čas inferencie znížil na 0,19 sekundy, čo je o 40 percent rýchlejšie ako verzia 5.0, a rýchlosť inferencie sa zvýšila o 15 percent na 90,2 slov za sekundu.
CEO SenseTime, Dr. Xu Li, verí, že rok 2024 bude rozhodujúcim rokom pre veľké modely, ktoré prejdú z unimodálnych na multimodálne. SenseTime sa sústreďuje na zvyšovanie interaktivity AI modelov a sľubuje „bezprecedentné transformácie v interakciách medzi ľuďmi a AI“.
SenseTime, založená v roku 2014 a so sídlom v Hongkongu, je jednou z najlepšie financovaných čínskych AI spoločností. V minulosti sa spoločnosť preslávila najmä svojím vizuálnym sledovacím softvérom využívajúcim rozpoznávanie tvárí.
Zdroj: the-decoder.com, analýza dát ChatGPT4o, Claude 3.5 Sonnet