Dr Commodore
LIVE

OpenAI crea SORA: l’AI capace di generare video realistici a partire dai prompt

OpenAI, la società leader nel campo dell’intelligenza artificiale creativa, cerca di stupire ancora una volta il mondo, questa volta non con un aggiornamento del celebre ChatGTP, bensì con un modello di AI nuovo e, soprattutto, innovativo.

SORA, questo il nome del software, è capace di generare interi video a partire da una singola descrizione inserita dall’utente, spingendosi così ben oltre la semplice generazione di immagini a partire da prompt di comando. Oltretutto, stando a quanto affermato dalla stessa OpenAI, sembrerebbe che i video generati da SORA siano realistici.

L’ultima fatica di OpenAI: SORA

Il modello generativo di video SORA è stato annunciato dalla stessa OpenAI attraverso un post sul proprio blog e sembrerebbe in grado di creare con verosimiglianza scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati del soggetto e dello sfondo”, tutto questo a partire dalle istruzioni impartite dall’utente.

Open AI SORA

LEGGI ANCHE: Stiamo iniziando a parlare di AI anche quando le AI non c’entrano nulla

Nella creazione di “scene realistiche e fantasiose” SORA non solo è in grado di apprendere e di comprendere i significati del prompt inserito, ma addirittura è in grado di capire come gli oggetti e le cose generate “esistono nel mondo fisico”.

Stando alle informazioni rilasciate dalla startup statunitense, sembra che tale modello generativo sia di gran lunga più avanzato di quello ideato da Google, Lumière, vista la “profonda comprensione del linguaggio” che permette a SORA di interpretare le istruzioni in modo più ampio (ciò gli permetterebbe di creare “dei personaggi che esprimono emozioni vibranti”) e vista la generazione di una fisica coerente all’interno del video.

Oltre a ciò, SORA è capace di fare più ripreseall’interno di un singolo video, offrendo così allo spettatore diversi punti di vista della medesima scena ritratta, come se venissero utilizzate più camere di ripresa. Secondo OpenAI, la funzione non altera i personaggi ritratti e lo stile visivo scelto per la scena, si tratta in tutto e per tutto di un’altra angolazione.

Da ultimo, il modello presentato è capace di animare un’immagine statica, generando un video a partire da una foto inserita. L’animazione secondo la società di Sam Altman tiene conto dell’intero contenuto dell’immagine, animando con precisione tutto, anche i più piccoli dettagli.

OpenAI ha affermato che, per il momento, il modello non verrà rilasciato al pubblico, la società vuole assicurarsi di limare al meglio tutte le imperfezioni di SORA (questo ha difficoltà a generare e a simulare le animazioni di una scena complessa e appare molto indecisa sui movimenti delle persone) e di implementare “diverse e importanti misura di sicurezza”, in modo che il modello non possa venire usato per scopi illeciti.

openai-logo

Fonti: 1

Articoli correlati

Francesco Lanciano

Francesco Lanciano

Classe 1998, videogiocatore incallito e da sempre appassionato alla tecnologia

Condividi