OpenAI Sora imponerer med vilde AI Videoer

OpenAI satte med deres ChatGPT en ny standard for praktisk AI som de fleste almindelige mennesker også kunne forholde sig til. Nu imponerer de igen med deres nye Sora som kan generere imponernede flotte AI genererede videoer udelukkende baseret på tekst prompts. Det er dog langt fra perfekt endnu...

OpenAI afslørede et værktøj torsdag, der kan generere videoer ud fra tekst prompts.

Den nye model, kaldet Sora efter det japanske ord for "himlen", kan producere realistiske optagelser op til et minut lange, der følger en brugers instruktioner både med hensyn til emne og stil. Ifølge et blogindlæg fra virksomheden er modellen også i stand til at skabe en video baseret på et stillbillede eller udvide eksisterende optagelser med nyt materiale. Sora er i stand til at generere videoer op til 60 sekunder lang fra tekstinstruktioner med evnen til at levere scener med flere karakterer, specifikke typer bevægelse og detaljerede baggrundsdetaljer.





"Vi underviser AI i at forstå og simulere den fysiske verden i bevægelse med det formål at træne modeller, der hjælper mennesker med at løse problemer, der kræver interaktion med den virkelige verden," står der i blogindlægget.

OpenAI sagde, at de har til hensigt at træne AI-modellerne, så de kan "hjælpe mennesker med at løse problemer, der kræver interaktion med den virkelige verden."

En video inkluderet blandt flere indledende eksempler fra virksomheden var baseret på opfordringen: "En filmtrailer med eventyrerne fra den 30-årige rummand iført en rød uldne strikket motorcykelhjelm, blå himmel, saltørken, cinematisk stil, optaget på 35 mm film, levende farver."





Virksomheden annoncerede, at de havde åbnet adgang til Sora for en håndfuld forskere og videoproducenter. Eksperterne ville gennemgå produktet, teste det for sårbarhed over for at omgå OpenAIs servicevilkår, der forbyder "ekstrem vold, seksuelt indhold, hadefulde billeder, berømthedslighed eller andres IP," ifølge virksomhedens blogindlæg. Virksomheden tillader kun begrænset adgang til forskere, visuelle kunstnere og filmmagere, selvom administrerende direktør Sam Altman reagerede på brugeres opfordringer på Twitter efter meddelelsen med videoklip, han sagde blev lavet af Sora. Videoerne bærer et vandmærke for at vise, at de er lavet af AI.

Samtidig sagde OpenAI, at Sora stadig er et arbejde i gang med klare "svagheder", især når det kommer til rumlige detaljer af et prompt, der blander venstre og højre samt årsag og virkning. Den gav eksemplet på at skabe en video af nogen, der tager en bid af en cookie, men at der ikke er et bidemærke lige efter.

Virksomheden lancerede billedgenerator Dall-E i 2021 og generative AI-chatbot ChatGPT i november 2022, der hurtigt akkumulerede 100 millioner brugere. Andre AI-virksomheder har lanceret værktøjer til video-generering, selvom disse modeller kun har været i stand til at producere få sekunders optagelser, der ofte har ringe sammenhæng med deres opfordringer. Google og Meta har sagt, at de er i gang med at udvikle generative videoværktøjer, selvom de ikke har frigivet dem til offentligheden. Onsdag annoncerede det et eksperiment med at tilføje dybere hukommelse til ChatGPT, så det kunne huske mere af dets brugeres samtaler.

OpenAI afslørede ikke, hvor meget optagelse der blev brugt til at træne Sora eller hvor træningsvideoerne måske stammer fra, ud over at fortælle, at samlingen af træningsmateriale indeholdt videoer, der både var offentligt tilgængelige og licenseret fra ophavsrettighedsejere. Virksomheden har flere gange været sagsøgt for påstået krænkelse af ophavsretten i træningen af sine generative AI-værktøjer.

