open ai sora

OpenAI a anunțat Sora, instrumentul AI care generează video din text

Sora este noul model generativ de inteligență artificială de la OpenAI pentru a crea videoclipuri pornind de la indicații textuale. Aflat în prezent în faza de preview, noul model este capabil să creeze videoclipuri fotorealiste cu o durată de până la 60 de secunde, valorificând capacitatea sa de a înțelege modul în care există lucrurile în lumea reală și combinând mai multe cadre laolaltă, fără întreruperea sau alterarea stilului.

Sam Altman, CEO OpenAI, a anunțat lansarea pe platforma de socializare X, iar instrumentul a fost imediat invadat de cereri pentru noi creații. Realiste, futuriste, nebunești, caricaturale… videoclipurile includ tot felul de creații automate realizate cu ajutorul inteligenței artificiale generative. Sora este capabil să creeze videoclipuri întregi dintr-un singur prompt sau să extindă videoclipurile generate pentru a le face mai lungi.

Altman a publicat videoclipuri cerute de tweeteri, demonstrând că rezultatele sunt imediate.

“Învățăm inteligența artificială să înțeleagă și să simuleze lumea fizică în mișcare, cu scopul de a antrena modele care să ajute oamenii să rezolve probleme care necesită interacțiune în lumea reală”, explică site-ul OpenAI care prezintă noul instrument text-to-video. “Sora poate genera videoclipuri cu o durată de până la un minut, menținând în același timp calitatea vizuală și respectarea indicațiilor utilizatorului.”

Sora generează conținut video AI extraordinar

Așadar, potrivit OpenAI, Sora poate construi scene extrem de detaliate, inclusiv mișcări complexe ale camerei și abordarea mai multor personaje. Din punct de vedere tehnic, Sora este un model de difuzie. Punctul său de plecare este un videoclip care arată ca un zgomot static, care este apoi transformat treptat în rezultatul final prin eliminarea zgomotului pas cu pas.

CITEȘTE ȘI
ChatGPT extinde 'Instrucțiunile personalizate' pentru utilizatorii serviciului gratuit. Momentan, nu și pentru cei din UE

OpenAI evidențiază, de asemenea, o problemă dificilă pe care a rezolvat-o în Sora, și anume păstrarea consistenței subiectului chiar și atunci când acesta iese temporar din vedere și păstrarea stilului vizual, lăsând modelul să opereze pe mai multe cadre odată, ceea ce îi conferă o anumită capacitate de a ști ce se va întâmpla în avans și de a planifica acest lucru.

OpenAI a prezentat mai multe videoclipuri impresionante create cu ajutorul Sora, inclusiv imagini istorice din California în timpul goanei după aur, o femeie elegantă care se plimbă pe o stradă din Tokyo, câini golden retriever care se joacă în zăpadă și altele. Unele videoclipuri generate pot prezenta mișcări fizic neverosimile, recunoaște OpenAI, așa cum se arată într-un videoclip în care un bărbat merge pe o bandă rulantă în direcția greșită sau un altul în care nisipul se transformă într-un scaun și prezintă mișcări contra-intuitive.

Sora nu este încă disponibil pentru publicul larg

În prezent, noul model nu este încă deschis publicului larg, deoarece OpenAI lucrează la îmbunătățirea politicii de siguranță. Aceasta presupune, de exemplu, respingerea cererilor de introducere de text care includ violență extremă, conținut sexual, imagini care incită la ură sau care încalcă drepturile de proprietate intelectuală ale terților sau drepturile de confidențialitate ale vedetelor. În acest scop, OpenAI spune că lucrează cu experți în domenii precum dezinformarea, conținut care incită la ură și prejudecățile.

Sora nu este primul model de inteligență artificială din generația text-to-video care intră pe piață.

Printre alte soluții se numără Runway, Pika, Stability AI, Google Lumiere și altele. După cum au subliniat mai mulți comentatori de pe Hacker News, videoclipurile demonstrative produse de OpenAI sunt „cu siguranță selectate precum cireșele de pe tort” pentru a arăta modelul în cea mai bună formă, iar rezultatele ar putea fi foarte diferite atunci când se încearcă crearea unui videoclip pornind de la o idee foarte specifică.

CITEȘTE ȘI
S-a lansat căruciorul inteligent Ella, bazat pe A.I.

În plus, videoclipurile create de testeri par să fie de o calitate mai puțin ridicată. Acest lucru nu afectează însă caracterul impresionant al instrumentului Sora și elanul pe care îl poate genera în domeniul generării video din instrucțiuni de text.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top