La curiosità è il nucleo dell’intelligenza. È partendo da questo presupposto che gli scienziati informatici stanno cominciando a programmare le macchine in modo da renderle curiose, un approccio che potrebbe permettere ai robot di apprendere in modo più veloce di quanto non facciano ora e, perché no, in un futuro più lontano, imparare a formulare ipotesi aiutando così gli uomini a spingere più avanti le frontiere della conoscenza.
Sono più di uno i progetti che nel corso degli anni hanno visto i ricercatori lavorare allo sviluppo di “algoritmi della curiosità”, il punto è che imitare la curiosità umana resta una faccenda molto complessa. La maggior parte dei metodi messi a punto finora, infatti, trova un suo limite nella incapacità di valutare il peso di elementi artificiali nell’individuare qualcosa che potrebbe essere interessante prima di vederla: ad esempio, le persone a volte possono giudicare interessante un libro per la sua copertina.
Imparare a esplorare il mondo
C’è però chi sta provando a fare di meglio. Come Todd Hester e Peter Stone, due scienziati informatici in forze, rispettivamente, al Google DeepMind di Londra e all’Università del Texas di Austin, che si sono messi alla ricerca di una soluzione per rendere le macchine più intelligenti e capaci di esplorare il mondo che le circonda come farebbe un essere umano: «Non esplorare tutto e a caso, ma cercare di fare qualcosa di un po’ più intelligente», come ha specificato lo stesso Hester.
L’apprendimento per rinforzo
A questo scopo hanno messo a punto l’algoritmo Texplore-Venir (Targeted exploration with Variance-and-novelty-intrinsic-rewards), che si basa su una tecnica chiamata apprendimento per rinforzo, che al Google DeepMind utilizzano per insegnare ai programmi a padroneggiare videogiochi e giochi da tavolo.
In questa tecnica il sistema che cerca di raggiungere un obiettivo, ad esempio uscire da un labirinto, riceve una ricompensa ogni volta che una nuova mossa lo avvicina alla soluzione. In questo modo è più probabile che la macchina sperimenti nuove mosse in futuro, oltre a imparare con più efficacia e a migliorare progressivamente le sue prestazioni.
Ma Texplore-Venir fa anche qualcosa in più: aggiunge anche un obiettivo interno, per il quale il programma si auto-ricompensa quando impara qualcosa di nuovo. Così, mentre l’algoritmo apprende e costruisce un modello del mondo, al tempo stesso si ricompensa scoprendo informazioni nuove e diverse da quelle che ha già incamerato, ad esempio può cercare punti distanti su una mappa o ricette di cucina tipiche di quei luoghi.
Curiosi sì, ma non troppo!
I ricercatori hanno poi sperimentato il loro metodo in due scenari. Il primo virtuale, mettendo all’opera un bot, cioè un programma per computer, in un labirinto virtuale. Il secondo in uno scenario reale utilizzando il robot Nao un umanoide alto 50 centimetri e impiegato in numerosi laboratori di tutto il mondo. In entrambi i casi i risultati sono stati davvero eccellenti: sia il bot sia il robot, infatti, sono diventati molto più curiosi utilizzando Texplore-Venir, rispetto all’esplorazione casuale o a quando hanno utilizzato altri algoritmi.
Per i ricercatori si tratta di un passo molto importante per rendere sempre più flessibili i robot destinati a lavorare vicino all’uomo nelle case o nelle fabbriche. In questo percorso secondo Hester il passo successivo sarebbe utilizzare reti neurali profonde, algoritmi modellati sull’architettura del cervello, per meglio identificare nuove aree da esplorare e spingere la ricerca ancora più avanti. A questo punto però, si pone un altro problema: i test hanno anche mostrato che in diversi casi il robot ha perso punti nel raggiungimento del suo obiettivo proprio perché si è lasciato incuriosire da altri aspetti. Insomma, va bene la curiosità, che però non sia troppa!