Chatboti Novinky Umelá inteligencia

ChatGPT4o má ďalšiu konkurenciu – prekonáva ho čínsky model SenseNova

SenseTtime

Na Svetovej konferencii o umelej inteligencii predstavila čínska spoločnosť SenseTime svoje nové multimodálne AI modely SenseNova 5o a vylepšený jazykový model SenseNova 5.5.

Prvý čínsky multimodálny model v reálnom čase

Čínska spoločnosť SenseTime, známa svojimi pokrokmi v oblasti umelej inteligencie, predstavila na Svetovej konferencii o umelej inteligencii v Šanghaji (WAIC) svoj nový multimodálny AI model SenseNova 5o.

Tento model je prvým čínskym multimodálnym modelom, ktorý dokáže poskytovať interakciu v reálnom čase na úrovni porovnateľnej s ChatGPT-4o od OpenAI.

SenseNova 5o dokáže spracovávať audio, text, obraz a video dáta, čo umožňuje používateľom komunikovať s modelom jednoduchým hovorením.

SenseTime v rámci prezentácie predviedla aj demo, ktoré ukázalo schopnosti modelu rozpoznávať a popisovať jednotlivé objekty pomocou kamery smartfónu, čím pripomenula nedávnu prezentáciu OpenAI a jej GPT4o.

Tento model je obzvlášť vhodný pre reálne konverzácie, čo otvára nové možnosti pre interakciu medzi ľuďmi a AI.

Tweet s videom: Prezentácia modelu preložená do angličtiny

Vylepšený jazykový model SenseNova 5.5

Okrem multimodálneho modelu SenseNova 5o predstavila spoločnosť aj vylepšenú verziu svojho jazykového modelu SenseNova 5.5.

Podľa SenseTime dosahuje táto verzia o 30 percent vyšší výkon v porovnaní s predchádzajúcou verziou 5.0, ktorá bola uvedená len pred dvoma mesiacmi.

Tréningové dáta zahŕňali viac ako desať terabajtov vysokokvalitných údajov, vrátane mnohých synteticky generovaných reťazcov na zlepšenie schopností modelu v oblasti logického uvažovania.

SenseNova 5.5 prináša významné zlepšenia v matematickom uvažovaní (+31,5 %), angličtine (+53,8 %) a v schopnosti nasledovať pokyny (+26,8 %).

Tieto vylepšenia posúvajú interaktivitu a mnohé kľúčové ukazovatele na úroveň porovnateľnú s GPT-4o.

V čom prekonal ChatgPT4o?

Firma Sensetime zverejnila na podujatí aj infografiku s 8 hodnotiacimi kritériami, pričom podľa jej vyhodnotenia sa ich chatbot SenseNova 5.5 ocitol na prvom mieste s finálnym skóre 69.9 bodov.

Na druhom mieste skončil ChatGPT4o od OpenAI s rovnakým hodnotením 69.9 bodu, no s horšími výsledkami v piatich z 8 hodnotiacich kritérií.

Tesne tretí skončil nedávno predstavený Claude 3.5 Sonnet od spoločnosti Anthropic.

SenseTime 5.5 prekonal GPT-4 v kategóriách MMB v1.1, MMStar, MathVista, AI2D a OCRBench, čo znamená, že lepšie rozumie a generuje text na základe multimediálnych vstupov, rieši matematické úlohy, rozpoznáva text a analyzuje obrázky.

Naopak, GPT-4o bol lepší v kategóriách MMMU, HallusionBench Avg. a MMVet, čo naznačuje jeho lepšie schopnosti v multimodálnom porozumení, zvládaní halucinácií a v schopnosti vizuálneho porozumenia a spracovania rôznych typov vizuálnych údajov.

Budúcnosť AI modelov a investície do edge-based riešení

SenseTime sa tiež zameriava na vývoj jazykových modelov pre edge-based riešenia, ktoré sú rýchle a nákladovo efektívne. S modelom SenseChat Lite-5.5 sa čas inferencie znížil na 0,19 sekundy, čo je o 40 percent rýchlejšie ako verzia 5.0, a rýchlosť inferencie sa zvýšila o 15 percent na 90,2 slov za sekundu.

CEO SenseTime, Dr. Xu Li, verí, že rok 2024 bude rozhodujúcim rokom pre veľké modely, ktoré prejdú z unimodálnych na multimodálne. SenseTime sa sústreďuje na zvyšovanie interaktivity AI modelov a sľubuje „bezprecedentné transformácie v interakciách medzi ľuďmi a AI“.

SenseTime, založená v roku 2014 a so sídlom v Hongkongu, je jednou z najlepšie financovaných čínskych AI spoločností. V minulosti sa spoločnosť preslávila najmä svojím vizuálnym sledovacím softvérom využívajúcim rozpoznávanie tvárí.

Zdroj: the-decoder.com, analýza dát ChatGPT4o, Claude 3.5 Sonnet

Som zakladateľ portálov Kryptonovinky.sk, FTnews.sk a Futuremag.sk. O Bitcoine, finančných trhoch a umelej inteligencii (AI) natáčam aj videá na YouTube v rámci projektov Zaujalo ma Krypto & Fintech a Zaujalo ma AI.