C’è una nuova intelligenza artificiale fortissima a poker

Ha battuto alcuni dei giocatori più abili e ha imparato a bluffare, dice una ricerca pubblicata su Science

(Sony Pictures)
(Sony Pictures)

Un sistema di intelligenza artificiale che si chiama Pluribus, sviluppato da Facebook e dai ricercatori della Carnegie Mellon University (Stati Uniti), ha vinto a poker contro alcuni dei più forti giocatori di “Texas hold ‘em”, nella sua versione da sei persone. Nel corso di 12 giorni e di 10mila mani giocate, il sistema ha vinto in media 5 dollari per mano, arrivando a totalizzare circa mille dollari all’ora, con vincite decisamente superiori alla media. I risultati dell’esperimento sono stati pubblicati sulla rivista scientifica Science.

Per prima cosa, i ricercatori hanno insegnato a Pluribus a giocare a poker facendolo partecipare a partite nelle quali aveva come avversari delle sue copie, seguendo una pratica piuttosto diffusa per fare in modo che le intelligenze artificiali (AI) imparino a svolgere un determinato compito. Semplificando, il sistema impara dai propri errori, giocando contro se stesso in migliaia di partite. Già in questa fase Pluribus si è rivelato molto abile, impiegando pochi giorni per sviluppare le sue capacità e senza avere bisogno di computer particolarmente potenti, se confrontati con altri sistemi impiegati per lo sviluppo di intelligenze artificiali.

In seguito, i ricercatori hanno regolato il comportamento dell’AI in modo che lavorasse per prevedere al massimo due o tre mani successive a quella in corso, al posto di predire l’intero esito di una partita. Lo studio spiega che questa soluzione ha reso possibile progressi superiori alle aspettative, perché in molti casi nel poker le strategie a breve termine sono più vantaggiose rispetto a quelle a lungo termine, più utili invece per altre tipologie di giochi come gli scacchi o il Go.


Pluribus ha imparato a bluffare, ingannando in più occasioni i giocatori professionisti che lo sfidavano. L’AI non aveva alcuna possibilità di analizzare le espressioni o la postura dei giocatori, dettagli cui i professionisti fanno caso durante le partite, alla ricerca di qualche indizio sulla strategia che gli altri stanno seguendo. Nonostante ciò, Pluribus ha sviluppato comunque la capacità di analizzare e prevedere le strategie dei suoi sfidanti, anche quando bluffavano, come ha spiegato uno dei ricercatori a The Verge: «L’AI non vede un bluff come qualcosa di ingannevole. Vede semplicemente la decisione che porterà a massimizzare la vincita in una particolare situazione. Ciò che abbiamo dimostrato è che un’AI può bluffare, e che può farlo meglio di un essere umano».

Nonostante i risultati promettenti dell’esperimento, è presto per stabilire se una AI sia in assoluto più abile a giocare a “Texas hold ‘em” rispetto agli umani. È vero che nei 12 giorni di partite i giocatori non sono mai riusciti a trovare qualche punto debole nell’AI che rimanesse costante, e che potesse essere sfruttato a loro vantaggio.

Per sperimentare i sistemi di intelligenza artificiale si usano spesso i giochi: hanno regole chiare e definite, più comprensibili nella fase di apprendimento automatico. Tre anni fa AlphaGO, un’intelligenza artificiale di Google, aveva battuto il campione mondiale del complicato gioco da tavolo Go, dimostrando le grandi potenzialità del sistema. Il caso di Pluribus sembra essere ancora più promettente, perché il poker implica un numero maggiore di variabili legate all’approccio di ogni giocatore alle partite, e alle sue scelte, che non sempre possono essere previste con grande accuratezza.