Tempo fa Google ha lanciato un suo agente di intelligenza artificiale generativa chiamato Big Sleep, che ha già mostrato incredibili risultati: ha scoperto la prima falla della sicurezza di un programma, che è pure la prima falla mai scoperta da un’AI della storia (o almeno la prima che è mai stata annunciata al pubblico).
L’agente AI di Google ha scoperto una falla della sicurezza
Questa falla è stata individuata in SQLite, una delle librerie di database più fornita al mondo, e si verifica quando si causa un errore di stack buffer undershow in determinate circostanze. L’errore consiste nel software della libreria che prova a richiamare una posizione di memoria antecedente al punto in cui inizia il buffer, causando l’esecuzione di un codice non autorizzato oppure il crash completo del programma. Non ci sono rischi per i siti che si affidano a questa libreria, considerato che l’errore si verifica soltanto in una sua versione sperimentale.
La scoperta della falla è avvenuta il mese scorso, e appena Google ne è venuta a conoscenza ha contattato gli sviluppatori che stanno lavorando a SQLite, in modo tale che potessero correggerla ed evitare che si riscontrasse l’errore in futuro.
I progressi AI di Google
Google ha annunciato Big Sleep quest’estate con il nome Project Naptime (ossia “Progetto Pisolino“) come AI che ha il compito di simulare il comportamento di un essere umano che cerca una vulnerabilità, e può anche creare delle simulazioni delle falle (ad esempio eseguendo degli script Python in degli ambienti protetti). Il progetto è diventato ciò che è oggi grazie alla strettissima collaborazione tra la società Deep Mind e il team Project Zero degli ultimi mesi.
Per il colosso di Mountain View questa non è l’unica novità in ambito AI. La scorsa settimana ha infatti rivelato che il 25% del suo codice non è generato da esseri umani ma dall’AI, con ingegneri che comunque controllano e correggono il suo operato. Questi due traguardi dimostrano i progressi repentini che sta facendo la tecnologia, e a questo punto c’è da chiedersi quanto velocemente si evolveranno anche nei prossimi mesi.