AttnGAN è un progetto di Microsoft che crea delle immagini in base a un input testuale
Si chiama AttnGAN la nuova IA presentata dai ricercatori del Deep Learning Technology Center di Microsoft. Questa nuova intelligenza artificiale, un Generative Adversarial Network basato sul machine learning, ricostruisce delle immagini in seguito a input testuali. L’algoritmo elabora senza problemi richieste semplici, come quella di un uccello – esempio dei ricercatori di Microsoft durante la presentazione – ma un sovraccarico di immagini potrebbe restituire un output inquietante.
Alcuni utenti hanno infatti provato a far ricreare all’IA immagini complesse fornendo più informazioni, ricevendo risultati bizzarri. Il motivo sembra semplice, e Microsoft stessa lo spiega:
Il bot disegnatore di Microsoft è stato addestrato su un set di dati contenente immagini con abbinate delle didascalie che permettono ai modelli di imparare ad abbinare le parole alla rappresentazione visiva di tali parole. Il GAN, ad esempio, impara a creare l’immagine di un uccello quando una didascalia dell’immagine di un uccello riporta la parola ”uccello” e, allo stesso tempo, impara che aspetto dovrebbe avere l’immagine di un uccello.
L’algoritmo deve quindi prima apprendere un’immagine ricollegandola al testo per poter emettere un output corretto. Questo porta quindi ad alcuni risultati inquietanti che ben si allontanano dall’input inserito. Stiamo comunque parlando di una macchina, quindi, nel complesso, possiamo ritenerci soddisfatti dal tipo di risultati ottenuti. Vediamo qualche esempio.
Naturalmente l’intelligenza artificiale è ancora in fase di sviluppo e, attualmente, è disponibile una versione di prova via browser creata da Cris Velenzuela. Cosa pensate di questa nuova intelligenza artificiale? Fateci vedere i risultati della versione di prova!
Per rimanere informati sul mondo nerd, continuate a seguirci sul nostro sito DrCommodore.it e su Facebook, Instagram, Telegram, YouTube, Discord e Twitch.