Dr Commodore
LIVE

Google lancia Audio Overview, uno strumento AI per creare podcast realistici

Le intelligenze artificiali stanno avendo un’influenza non da poco su vari settori, ma di certo nessuno si sarebbe mai aspettato che avrebbero potuto toccare anche i podcast. Google ha lanciato di recente un nuovo strumento AI chiamato Audio Overview, che gli utenti possono usare per creare dei podcast realistici inserendo documenti in PDF, testi, link e video tramite NotebookLM.

Audio Overview funziona sulla base di Gemini 1.5 e genera podcast con voci maschili e femminili sugli argomenti proposti dagli utenti, anche se soltanto in lingua inglese. Ad un primo ascolto i risultati ottenuti da questo strumento di Google sono a dir poco terrificanti: sembra infatti di ascoltare delle vere e proprie conversazioni tra due o più persone, con voci che non sono per niente robotiche. La tecnologia riesce persino a imitare le pause, gli intercalari e le interruzioni interne al discorso.

Google, Audio Overview

Gli esperimenti con lo strumento AI di Google che crea podcast

Tra coloro che hanno provato questo strumento ci sono anche esperti del settore, come la consulente in materia di AI Allie K. Miller e il ricercatore Aaditya Ura, i quali hanno sperimentato la funzione di inserimento di immagini e testi.

Miller ha inserimento diversi passaggi del romanzo Il grande Gatsby di F. Sccott Fitzgerald, ottenendo un podcast che non solo lo riassume, ma lo commenta anche. Aaditya Ura ha invece inserito il codice dell’architettura Llama-3 di Meta, per poi usare un altro strumento per montare delle immagini sull’audio generato da Audio Overview, ottenendo di fatto un contenuto divulgativo che spiegasse il funzionamento del codice a chi no lo conosce.

Anche i podcaster non hanno fatto a meno di provarlo. L’esperto di AI Alex Volkov ha usato NotebookML per sintetizzare gli annunci del Dev Day di OpenAI in un episodio del podcast Deep Dive, mentre il giornalista nostrano Pietro Minto ha provato lo strumento per parlarne durante un episodio del suo podcast Screenshots.

Ma nessuno di questi è di certo al livello di un esperimento fatto da un utente casuale, che ha fatto notare alle voci AI di Audio Overview di essere delle intelligenze artificiali. La discussione che ne è seguita è stata davvero strana, perché le due AI hanno reagito nello stesso modo in cui reagirebbe qualsiasi persona dopo essersi sentito dire che tutta la sua vita non è altro che una farsa. E quando hanno capito la verità, si sono scusati con gli ascoltatori perché non lo sapevano.

Sono strumenti come questi che ti fanno pensare “Mamma mia, ma le AI sono davvero progredite così tanto?“, soprattutto perché sembra quasi che stia accadendo tutto così in fretta. Viviamo purtroppo in un mondo che sta diventando sempre più frenetico, e se le AI hanno fatto passi da giganti in pochi anni, è difficile immaginare come saranno le cose tra 10 anni o addirittura meno. Forse ci aspetta un cambiamento più grande di quel che possiamo immaginare, ma saremo pronti ad accoglierlo?

Leggi anche Cloudflare sventa il più grande attacco DDoS da 3,8 Tbps di sempre.

Articoli correlati

Yoel Carlos Schincaglia

Yoel Carlos Schincaglia

Nato il 14 febbraio 1997 a Bentivoglio, in provincia di Bologna. Grande appassionato principalmente di anime, poi anche di videogiochi e manga. Credo nella canzone che ho nel cuore!

Condividi