Google zdvíha latku pomocou nástrojov Veo 2 a Imagen 3

Konkurencia v oblasti umelej inteligencie naberá na obrátkach. OpenAI so svojím ChatGPT Search vyzýva Google na súboj vo sfére vyhľadávania, zatiaľ čo Google zvyšuje latku v generovaní textov a videí prostredníctvom svojich aktualizovaných modelov Veo 2 a Imagen 3. O správe informuje portál BusinessToday.

Model Veo 2 predstavuje pokrok v oblasti porozumenia fyzike a kinematografii, čo mu umožňuje vytvárať videá s bohatými štýlmi a efektmi.

Používatelia môžu nastavovať špecifické kamerové parametre, napríklad ohniskovú vzdialenosť, pričom maximálna dĺžka klipov dosahuje viac ako dve minúty, čo je šesťkrát viac ako konkurenčný nástroj Sora od OpenAI.

Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥

We’re also releasing an improved version of our text-to-image model, Imagen 3 – available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4

— Google DeepMind (@GoogleDeepMind) December 16, 2024

Google zdôrazňuje, že Veo 2 trpí menej halucináciami, čo je dlhodobý problém väčšiny AI generátorov videí.

Dôležitým aspektom Veo 2 je bezpečnosť. Všetky generované videá obsahujú neviditeľný vodoznak, ktorý potvrdzuje ich pôvod. Tento krok má zabrániť šíreniu deepfake videí a dezinformácií. V súčasnosti je Veo 2 dostupný výhradne cez platformu VideoFX od Google Labs, kde záujemcovia môžu požiadať o prístup prihlásením sa na čakaciu listinu.

Pokiaľ ide o Imagen 3, prináša ešte realistickejšie a vizuálne pútavejšie obrázky. Od fotorealistických zobrazení po umelecké štýly ako anime. V blogovom príspevku spoločnosti Google sa uvádza, že najnovšia verzia Imagen 3 dokáže ešte presnejšie reagovať na zadania a vytvárať vizualizácie s výrazne bohatšími detailmi a textúrami.

We’ve also enhanced Imagen 3’s ability to:
▪️ Produce diverse art styles: realism, fantasy, portraiture and more
▪️ More faithfully turn prompts into accurate images
▪️ Generate brighter, more compositionally balanced visuals

→ https://t.co/MmdiHyrugR pic.twitter.com/L1l2Qzs5up

— Google DeepMind (@GoogleDeepMind) December 16, 2024