Perché la vittoria di AlphaGo è importante

L'intelligenza artificiale di Google ha superato il paradosso per cui sappiamo più cose di quante ne riusciamo a spiegare, racconta il New York Times

(Google DeepMind)
(Google DeepMind)

AlphaGo, l’intelligenza artificiale (AI) di Google DeepMind, ha battuto il campione mondiale del complicato gioco da tavolo Go in una serie di partite molto appassionante e che ad alcuni ha ricordato la sfida a scacchi tra Deep Blue, il computer di IBM, e il campione di scacchi Garry Kasparov alla fine degli anni Novanta. AlphaGo ha battuto Lee Se-dol in quattro partite su cinque a un gioco che ha molte più variabili rispetto a quelle degli scacchi, dimostrando capacità inimmaginabili fino a qualche tempo fa e che secondo gli esperti saranno alla base dei futuri sistemi informatici “intelligenti”.

A Go si gioca in due, davanti a una griglia 19 x 19 che viene chiamata goban. Per vincere è necessario conquistare una porzione di goban superiore a quella dell’avversario, collocando le proprie pedine sulla griglia. Ogni giocatore può catturare una o più pedine dell’avversario se riesce a circondarle completamente con le proprie pedine. Il giocatore deve quindi muoversi cercando di bilanciare la necessità di espandere il controllo sulla griglia con quella di difendersi dall’avversario. Il gioco finisce quando entrambi i giocatori passano a vicenda una mano, cosa che indica il fatto che nessuno dei due ha ulteriori possibilità di espandere il proprio territorio o di ridurre gli spazi occupati dall’avversario. Su un singolo goban ci sono 4,63 x 10170 diverse posizioni possibili, dato che fa ben capire quale sia l’enorme livello di complessità del gioco.

Come spiega il docente del Massachusetts Institute of Technology (MIT), Andre McAfee, con il collega Erik Brynjolfsson sul New York Times, a differenza degli scacchi “nessuno sa spiegare come si giochi a Go ai livelli più alti. Gli stessi giocatori più abili non riescono ad accedere alle conoscenze che gli permettono di giocare così bene”. Il fenomeno è conosciuto da tempo e riguarda tutti, non solo i giocatori davanti a una scacchiera: non sappiamo di preciso come facciamo a raggiungere la coordinazione necessaria per guidare un’automobile, o come riusciamo a distinguere una faccia tra centinaia di altri volti, eppure lo facciamo di continuo e bene. Lo scienziato e filosofo Michael Polanyi descrisse il fenomeno efficacemente: “Sappiamo più cose di quelle che riusciamo a spiegare”; per questo motivo per descriverlo si parla di solito di “Paradosso di Polanyi”.

Nonostante l’esistenza del paradosso, siamo riusciti a fare grandi cose in molti campi, compreso naturalmente quello informatico. Rendere automatiche attività complesse, come per esempio calcolare le tasse od organizzare gli orari dei voli di un’intera compagnia aerea, richiede una mole enorme di lavoro da parte dei programmatori, che devono considerare tutte le variabili possibili per fare in modo che poi i loro programmi eseguano correttamente i compiti che gli assegnano, senza essere colti alla sprovvista.

McAfee e Brynjolfsson scrivono che l’attuale approccio nella programmazione dei computer è molto limitante e taglia fuori molti ambiti, compreso quello di gestire una partita a Go, dove si sanno più cose di quante si riescano a spiegare, o di riconoscere oggetti comuni nelle fotografie, tradurre testi, creare interazioni tra macchine ed esseri umani in un linguaggio naturale e colloquiale come avviene tra due persone. Lo stesso Deep Blue di IBM ottenne i suoi risultati seguendo quelle soluzioni: i suoi programmatori lo riempirono di milioni di schemi su partite di scacchi, tra le quali poteva poi scegliere la mossa da fare, sfruttando la sua potenza di calcolo.

Per giocare a Go un approccio simile a quello di Deep Blue sarebbe stato impossibile: come abbiamo visto le combinazioni sulla scacchiera sono tantissime, talmente numerose da rendere impossibile il calcolo di tutte le alternative possibili in tempi accettabili da parte di un computer. E le cose si complicano ulteriormente col fatto che il gioco è talmente variabile da rendere complicato persino studiare la prima mossa da fare per avere qualche vantaggio sull’avversario.

L’articolo del New York Times spiega che cosa hanno quindi fatto gli ideatori di AlphaGo per superare il problema:

Le vittorie di AlphaGo dimostrano chiaramente la forza di un nuovo approccio nel quale invece di provare a programmare strategie, si costruiscono sistemi che possono imparare da soli a creare le strategie vincenti, valutando esempi di successi e fallimenti. Poiché questi sistemi non si basano sulla conoscenza umana per il compito che devono svolgere, non hanno limitazioni legate al fatto che sappiamo più cose di quante ne riusciamo a spiegare.

Semplificando, AlphaGo mette insieme sistemi più tradizionali, come l’utilizzo di simulatori e algoritmi di ricerca, con nuove soluzioni che di fatto permettono di superare il Paradosso di Polanyi. Il computer di Google ha utilizzato sistemi di apprendimento approfondito (deep learning), che in un certo senso imitano il modo in cui il nostro cervello impara cose nuove identificando schemi e cose rilevanti in una quantità enorme di informazioni che riceve di continuo.

L’apprendimento nei nostri cervelli è un processo che porta alla formazione e al rafforzamento di connessioni tra i neuroni. I sistemi di deep learning sfruttano un approccio simile, a tal punto da essere chiamati “reti neurali”. Si creano miliardi di nodi e connessioni all’interno di un software, e si utilizzano dei “set di formazione” come esempi per rendere più forti le connessioni tra i vari stimoli (una partita di Go in corso) con le risposte (la mossa successiva), poi il sistema viene esposto a un nuovo stimolo e si guarda qual è la sua risposta. AlphaGo ha anche giocato milioni di partite contro sé stesso, utilizzando un’altra tecnica che si chiama apprendimento per rinforzo, per ricordare le mosse e le strategie che hanno funzionato bene.

In un certo senso AlphaGo è stata una delle migliori e più promettenti dimostrazioni delle potenzialità dell’apprendimento approfondito e di quello per rinforzo, soluzioni che esistono da tempo, ma su cui ci sono ancora molte cose da capire per sfruttarle al meglio con i sistemi informatici. Le implicazioni per la pratica saranno senza precedenti entro pochi anni, secondo gli esperti di informatica, e iniziamo già ad averne qualche indizio: dai sistemi per il riconoscimento dei volti alle auto che si guidano da sole, ambiti strettamente legati al Paradosso di Polanyi, almeno per quanto riguarda noi altri, intelligenze non artificiali.