Scimmie, Shakespeare, sciocchezze

Probabilmente non ve ne sarete accorti, visto che né il Corriere della Sera né Repubblica ne hanno parlato nella loro colonna infame: solo i lettori del Giornale possono aver visto un paio di settimane fa questo articolo, scoprendo che per Luigi Mascheroni A lover’s complaint sarebbe un sonetto. O magari siete degli esterofili e avevate letto il tutto sul sito della BBC, o meglio ancora avete letto il tutto sul blog di Massimo Lauria. Di che parlo? Ma delle scimmie che hanno ricreato tutta l’opera di Shakespeare!

Credo che tutti voi conosciate il Teorema della scimmia instancabile: se date a una scimmia una macchina da scrivere e tempo sufficiente, la scimmia prima o poi produrrà tutte le opere di William Shakespeare, ammesso e non concesso che la scimmia non spacchi prima la macchina da scrivere. A dire il vero sembra che una prima formulazione di questa affermazione, senza naturalmente le macchine da scrivere e probabilmente anche senza la scimmia, risalga addirittura ad Aristotele: questa versione non risale a Borges e alla sua Biblioteca di Babele, come molti pensano, ma a Émile Borel che la scrisse tra il 1913 e il 1914. Nella versione del Ventunesimo Secolo del Teorema, Jesse Anderson ha programmato delle Scimmie Elettroniche, le ha messe al lavoro prima sulla nuvola di Amazon e poi su un proprio PC, e ha pazientemente aspettato che le varie opere del bardo di Stratford-on-Avon apparissero nel loro originale fulgore, o almeno in quello immortalato dal Progetto Gutenberg. Il risultato finale, con un po’ di spiegazioni tecniche, lo trovate sul blog di Anderson.

Tutto bene? Per nulla. Il progetto, almeno per quanto mi riguarda, è solo un’elaborata presa per i fondelli sicuramente dei giornalisti e probabilmente anche dei lettori: il probabilmente l’ho messo perché in fin dei conti l’amico ha specificato chiaramente cosa ha fatto e soprattutto cosa non ha fatto. Innanzitutto, le parole scespiriane sono state pesantemente compresse: non solo si sono perse maiuscole e minuscole (passi) e segni di interpunzione (e già qui…) ma sono stati persino eliminati gli spazi, per ottenere così un serpentone di lettere, anzi tanti serpentoni: uno per ciascuna opera, dagli 11621 caratteri di A Lover’s Complaint (per forza che è stato terminato per primo!) ai 136251 del Riccardo III col suo regno per un cavallo. Il programma si è limitato a generare casualmente una quantità di stringhe di nove caratteri (Anderson aveva iniziato con 24, ma si è accorto che non ce l’avrebbe mai fatta), controllare se qualcuna c’era nel corpus delle opere, e in caso positivo segnarla come trovata.

Come vi sarete sicuramente resi conto, questo programma è tutto meno che casuale: per fare un esempio non troppo calzante ma forse più comprensibile, è come avere un puzzle, prendere un pezzo a caso e vedere in quale posizione dell’opera terminata si troverebbe invece che verificare se si attacca a uno dei pezzi già esistenti. Oppure, se amate la fisica, il tutto ricorda un po’ il Diavoletto di Maxwell… Con le operazioni di Anderson è molto più facile trovare una stringa, per l’ottima ragione che si sa già cosa trovare: e in effetti ha dovuto generare meno di 7500 miliardi di stringhe (rispetto alle 5.429.503.678.976 diverse esistenti: ogni tanto un doppione gli sarà pure arrivato) per trovare le parole giuste. Sembrano dei grandi numeri, ma non sono nulla rispetto a quanto capiterebbe anche solo per trovare delle singole righe di una tragedia: questi risultati crescono infatti in maniera davvero esponenziale.

Forse insomma il commento più adatto all'”impresa” di Anderson è quello di Geoffrey Pullum su Language Log: il lavoro è stato più che altro un esercizio in un corso base di combinatoria che un’opera che meritasse tutta quella pubblicità nei vari media. E a proposito di compiti, ve ne lascio uno per sgranchirvi le meningi. Il corpus complessivo di Shakespeare, nella versione appiattita di Anderson, è lungo 3.696.348 lettere: diciamo 3.700.000 per fare cifra tonda. Supponiamo che una scimmia digiti una lettera per volta, e noi la cancelliamo se non è quella giusta nella lista: se il nostro corpus fosse insomma la Divina Commedia, cancelleremo tutte le lettere finché non arrivasse una n, poi cancelleremo quello che non è una e, a seguire le non l, non m, non e… Spannometricamente, quanti tasti dovrebbe battere il nostro primate per completare l’opera? Domanda bonus: se si usasse la distribuzione delle varie lettere in Shakespeare per scegliere le varie lettere, secondo voi si migliorerebbe sensibilmente il risultato?

Mostra commenti ( )