Novinky Umelá inteligencia Videá

Videli ste zábery z Runway? Generovanie videí pomocou AI urobilo ďalší krok vpred

Runway

Fanúšikovia umelej inteligencie (AI) opäť upriamili pozornosť na AI nástroje generujúce videá. Do rúk sa im totiž dostal doposiaľ zrejme najpokročilejší nástroj.

AI nástroje pre generovanie videí upútali pozornosť najmä vo februári, kedy spoločnosť OpenAI (ktorá stojí aj za ChatGPT) predstavila nástroj Sora. Do oného okamihu sme síce sledovali pokroky v generovaní videí z textových promptov (Runway, Pika Labs a podobne), no až Sora načrtla skutočnú budúcnosť AI videí tým, že prezentovala zábery naozaj pripomínajúce realitu.

Lenže od úvodu roka, kedy sa objavila Sora, uplynulo už takmer 5 ďalších mesiacov, a jej model je stále dostupný len pre vybranú skupinu ľudí, kde sa radia predovšetkým profesionáli z filmovej brandže či odborníci na kybernetickú bezpečnosť, ktorí posudzujú, či je vôbec bezpečné a etické sprístupniť tento nástroj hocikomu. Zjednodušene povedané “bežný smrteľník“ stále nemá možnosť Sora reálne otestovať.

Nástroj Sora tak medzitým má šancu dobiehať konkurencia, ktorá ju minulý týždeň v jednom kľúčovom bode naozaj predbehla. Nástroj Runway novej generácie s označením Gen-3 Alpha, ktorý tiež dokáže generovať AI videá blízke realite, sa totiž stal dostupný každému. Teda za predpokladu, že si človek za službu Standard 144 dolárov na rok ($12/mesiac) alebo bude platiť mesačné členské 15 dolárov.

Výsledky potešili

Runway predstavil model Gen3-Alpha už pred troma týždňami, no možnosť testovať ho v uzavretom prostredí získali sprvoti len influenceri, či rôzni špecialisti na tvorbu video obsahu.

Už od oného okamihu začali sociálne siete zaplavovať mnohé zaujímavé AI videá tretej generácie, ktoré sa stali rýchlo virálnymi obzvlášť X-ku. Niekoľko tých najlepších prikladáme v nasledujúcich „tweetoch“.

Tweet: Oficiálne video prezentujúce novú generáciu

Tweet: Jedno z najlepších videí v Runway. Akoby spojili sily Hans Zimmer a Christopher Nolan

Tweet: Runway zvláda (občasne) aj generovanie textu, tu je príklad s textom PROMPTS

Tweet: Výsledok po použití promptov „Riding a Bike“ a „Playing drum underwater“.

V čom je Runway skvelý a v čom zlyháva?

Runway vie veľmi dobre generovať videá z textových promptov. Z tohto pohľadu spomedzi nástrojov, ktoré sú k dispozícii aj verejnosti, dominuje.

Pochopiteľne však nie je bez chýb. Problémy má (podobne ako mnohé nástroje na generovanie obrázkov, ako je napríklad aj Midjourney) s generovaním končatín a prstov na nich. Čiže v momentoch, kedy sa vo videách objavujú ruky, častokrát dochádza k jednoznačným deformáciám.

Tweet: Runway, keď sa do toho zapoja aj ruky

Runway tiež neohúril, pokiaľ ide o generovanie videí z obrázkov. Čiže keď používateľ na rozdiel od čistého textového promptu (zadania) uploadne obrázok, ktorý chce rozhýbať, a k nemu ešte navyše doplní textovú inštrukciu (prompt). V tomto smere je zdá sa o čosi dokonalejší nástroj Dream Machine od Luma, ktorý je k dispozícii zatiaľ úplne všetkým a dokonca zadarmo.

Vo finále musíme zhodnotiť, že Runway je zatiaľ to najlepšie na generovanie videí z textových promptov, spomedzi tých, ktoré nemajú obmedzený pristup.

Dobrou správou zároveň je, že príchod tohto nástroja vytvára ďalší tlak na OpenAI a ich Sora. Aj v OpenAI určite cítia tlak a uvedomujú si, že konkurencia sa približuje.

Okrem Sora sú zatiaľ verejnosti neprístupne aj ďalšie podobné nástroje ako sú  Kling (z Číny) či Veo od Google Deepmind. Tie podľa toho, čo sme zatiaľ videli, sú tiež kvalitou veľmi blízke k Sora. Napríklad v poslednom tweete (pod textom) môžete vidieť, ako Kling „dooupravil“ slávnu scénu s Batmanom a Jokerom z filmu The Dark Knight. Máme sa teda na čo tešiť.

Zdroj: Autor, X

Som zakladateľ portálov Kryptonovinky.sk, FTnews.sk a Futuremag.sk. O Bitcoine, finančných trhoch a umelej inteligencii (AI) natáčam aj videá na YouTube v rámci projektov Zaujalo ma Krypto & Fintech a Zaujalo ma AI.