Il dilemma del prigioniero

Matematto divagatore; beatlesiano e tuttologo at large. Scrivo libri (trovi l'elenco qui) per raccontare le cose che a scuola non vi vogliono dire, perché altrimenti potreste apprezzare la matematica.

Il dilemma del prigioniero è uno degli esempi classici che vengono insegnati in un corso di teoria dei giochi, per mostrare cosa succede quando i giocatori hanno a loro disposizione scelte contrastanti tra loro. L’ambientazione è la seguente: Bonnie e Clyde sono fermati dalla polizia mentre cercano di vendere un oggetto rubato. I poliziotti sanno che il duo ha commesso la rapina del secolo, ma non ha prove per incriminarli: così decidono di indurre i due a confessare. La coppia viene divisa, e a ciascun criminale viene fatto il seguente discorso: “Sappiamo che siete colpevoli, ma non possiamo dimostrarlo; ma intanto vi possiamo tenere dentro per un annetto per ricettazione. Se però uno solo di voi confessa, lo libereremo e metteremo in carcere l’altro per dieci anni. Se infine confessate entrambi, allora vi farete cinque anni a testa”. Cosa faranno i nostri eroi?

tabella per il dilemma del prigioniero

Se i due potessero mettersi d’accordo, non c’è storia: terrebbero entrambi la bocca chiusa, se ne starebbero un anno in prigione, e poi andrebbero a farsi la bella vita. Ma non possono parlare! Il ragionamento di Bonnie è dunque il seguente: “Immaginiamo che Clyde confessi: anche a me a questo punto conviene confessare, perché mi faccio solo cinque anni invece che dieci. E se Clyde non confessasse? È la stessa cosa: mi conviene confessare, perché resterò libera invece di fare un anno in gattabuia”. Per Clyde la situazione è simmetrica: quindi entrambi, immaginando che siano criminali logici, confesseranno e si troveranno in una situazione non ottimale.

Il guaio è che non ci si può fare proprio nulla. La strategia che ho indicato per il duo è quella che calcola l’equilibrio di Nash, cioè la strategia che massimizza il risultato personale indipendentemente da quanto l’altro giocatore fa. Due giocatori logici ricadranno necessariamente in questa strategia. Certo, le cose potrebbero cambiare se si sapesse che si presenteranno tante occasioni consecutive di giocare lo stesso gioco (magari senza andare in prigione, ma semplicemente per potere o meno guadagnare qualche soldino): la strategia dei giocatori cambierebbe notevolmente, e alcuni esperimenti fatti al computer mostrano che il programma con la strategia “occhio per occhio” (“tit for tat”) – alla partita N+1 gioca immaginando che l’altro programma ripeta la scelta che aveva scelto alla partita N – ottiene generalmente i risultati migliori. Ma non divaghiamo, e chiediamoci se è possibile sfruttare a proprio favore la struttura del gioco.

Beh, in alcune condizioni è possibile! Nello show britannico Golden Balls, i due giocatori dovevano decidere se dividersi il premio finale. Più precisamente, ciascuno di loro ha due scelte: “split” (dividi) o “steal” (ruba). Se entrambi scelgono “split” il premio viene diviso a metà: se uno sceglie “split” e l’altro “steal”, quest’ultimo si prende tutto il montepremi; ma se entrambi scelgono “steal” rimarranno a bocca asciutta. Chiaramente questa è un’istanza del dilemma del prigioniero: a ciascuno converrebbe dire “steal”, ma se fanno così perdono tutto. I creatori dello show, essendo persone perfide, lasciavano i due giocatori a discutere per un po’ di tempo davanti alle telecamere, il che era probabilmente la parte più divertente di tutta la trasmissione. Generalmente ciascun contendente cercava di convincere l’altro che lui avrebbe scelto “split”… salvo poi cambiare idea nel segreto della votazione, nel miglior spirito “panem et circenses”. Ma una volta non capitò esattamente così.

Un partecipante, Nick, infatti, attaccò subito dicendo all’altro “Guarda, io scriverò “steal”. Non me ne importa un tubo di perdere tutto, è una questione di principio: però se tu scriverai “split”, e quindi vincerò, ti prometto che dopo la trasmissione dividerò con te la somma. Certo, ti dovrai fidare di me: ma tanto se non ti fidi non avrai comunque nulla”. Il conduttore e il pubblico rimasero di sasso, ma Nick rimase irremovibile. Alla fine i due giocatori indicarono la propria scelta: il contendente scrisse “split”, mentre Nick… scrisse anch’egli “split”! In pratica Nick aveva effettivamente intenzione di dividere i soldi, ma non fidandosi dell’altro fece in modo di cambiare il gioco. Dal punto di vista dell’opponente, infatti, la matrice non è più due per due, ma uno per due, visto che Nick avrebbe scelto “steal”. A questo punto la scelta più logica era appunto sperare nella bontà d’animo di Nick, che aveva appunto puntato su questo. Carino, vero? C’è anche la prova televisiva.

(Codino pubblicitario: ho preso l’esempio dal recentissimo ebook di Presh Talwalkar, The Joy of Game Theory. Se siete di quelle persone che non sono interessate tanto alla teoria “teorica” dei giochi, ma vuole vedere come funziona nella vita di tutti i giorni, non potete fare a meno di prenderlo!)

Tag: teoria dei giochi

Il dilemma del prigioniero

Consigliati

C’è un motivo se i cappellai erano considerati “matti”

Per rendere il cibo fotogenico per la pubblicità ci si inventa la qualunque

L’articolo che rivelò le bugie del governo americano su Hiroshima, nel 1945