Quando è meglio tirare a indovinare?

È di nuovo tempo di concorsone, e di domande a risposta multipla. Se ve ne ricordate, ne avevo già parlato un paio d’anni fa: ai tempi avevo fatto una rapida analisi, mostrando che a seconda di quanto costa sbagliare una domanda rispetto a non dare risposta e a quante sono le risposte sensate tra cui si è indecisi può convenire tirare a indovinare piuttosto che lasciare perdere. Ora sono certo che siate pronti a un passo successivo, che forse vi sembrerà poco intuitivo… ma la matematica non è solo intuizione.

In questo caso, le scelte per ogni risposta erano quattro; una risposta corretta dava un punto, una risposta errata toglieva mezzo punto, una mancata risposta non muoveva la classifica… pardon, il punteggio. L’analisi del valore atteso che avevo fatto due anni fa è molto semplice. Tirare assolutamente a caso è nocivo, visto che il valore atteso è negativo (in un caso su quattro guadagni 1 e negli altri tre perdi 0,5: il risultato statistico è -0,125). Eliminando una risposta come chiaramente errata e scegliendo a caso tra le altre tre si è statisticamente neutri, mentre se si riesce a limitare la scelta a due sole possibilità allora conviene lanciare una monetina virtuale, con un risultato atteso medio di 0,25 punti. Fin qui la teoria di base. Ma un Vero Matematico non si ferma mica qua, e – udite, udite! – può persino accorgersi che c’è una vita reale fuori dai numeri!

La semplice analisi statistica modellata qui sopra infatti si dimentica di un “banale” particolare: che esiste una soglia minima, in questo caso 35 punti rispetto a 50 domande, sotto la quale non si passa la preselezione. Detto in altri termini, ottenere 34,5, 30, oppure 0 è assolutamente identico dal punto di vista del risultato (negativo) ottenuto. Non so se ottenere 35, 40 o 50 cambiasse qualcosa, ma supponiamo di no. Questa semplice considerazione ci può portare molto lontano, se abbiamo voglia di fare un po’ di conti… o almeno di farli fare a un computer. Io sono della vecchia scuola, così ho preso un foglio di carta e una penna e ho provato a vedere cosa succede in una situazione semplificata: ci sono dieci domande, occorre fare almeno 7 punti, su sei domande sono certo, mentre sulle altre ho esattamente lo stesso tipo di indecisione, cioè scelgo sempre a caso tra due, tre oppure tutte e quattro le risposte. Posto che se le si lascia tutte in bianco evidentemente non si passerebbe la prova, a quante domande conviene tentare di dare una risposta?

Qui sotto potete vedere alcune tabelle, relative ai vari casi possibili; le colonne corrispondono al numero di domande a cui si risponde, mentre le caselle indicano il punteggio ottenuto e la probabilità di ottenerlo. Se la casella è in neretto allora si è passato l’esame, altrimenti no. Iniziamo con il caso più favorevole, quello in cui si sceglie tra due risposte possibili:

1 2 3 4
OK 7: 1/2 8: 1/4 9: 1/8 10: 1/16
      7,5: 3/8 8,5: 4/16
        7: 6/16
KO   6,5: 2/4 6: 3/8 5,5: 4/16
  5,5: 1/2 5: 1/4 4,5: 1/8 4: 1/16

 
Come forse potevate immaginare, conviene provare a rispondere a tutte e quattro le domande, e avere così più del 68% di possibilità (11/16, per la precisione) di passare l’esame. Quello che non conviene assolutamente fare è rispondere a solamente due domande: in questo caso la possibilità è solo del 25%, mentre con una oppure tre risposte a caso la possibilità di passare è il 50%. Anche il caso del candidato più capra, quello che non sa proprio che pesci pigliare, rispecchia la mera logica statistica, che dice di rischiare il meno possibile:

1 2 3 4
OK 7: 1/4 8: 1/16 9: 1/64 10: 1/256
      7,5: 9/64 8,5: 12/256
        7: 54/256
KO   6,5: 6/16 6: 27/64 5,5: 108/256
  5,5: 3/4 5: 9/16 4,5: 27/64 4: 81/256

 
In definitiva, in un caso come questo dove il valore atteso per ogni tentativo è negativo conviene giocare con la strategia “o la va o la spacca”. La probabilità di riuscita è solo del 25%, ma comunque meglio che nulla. Il caso più interessante è però, e forse potevamo aspettarcelo, quello di mezzo; quello insomma dove abbiamo una possibilità su tre di indovinare la risposta, e la statistica dice che provare o non provare è ininfluente. Cosa otteniamo?

1 2 3 4
OK 7: 1/3 8: 1/9 9: 1/27 10: 1/81
      7,5: 6/27 8,5: 8/81
        7: 24/81
KO   6,5: 4/96 6: 12/27 5,5: 32/81
  5,5: 2/3 5: 4/9 4,5: 8/27 4: 16/81

 
Se proviamo a rispondere a una sola domanda, abbiamo una probabilità su 3 (33% circa) di passare l’esame. Con due domande, scendiamo a 1/9 (11% circa); con tre domande risaliamo leggermente a 7/27, cioè quasi il 26%. Ma se proviamo a rispondere a tutte e quattro le domande, la percentuale di riuscita sale a ben 33/81, cioè più del 40%!

Come mai tutta questa differenza di risultati? Il valore atteso del punteggio non è sempre lo stesso? Certo che sì. Ma ribadisco: noi non stiamo cercando di massimizzare il valore atteso, bensì la probabilità di raggiungere una certa soglia. Possiamo allora permetterci il lusso di accettare di poter avere un punteggio molto più basso, che abbassa pesantemente il valore atteso, se in cambio riusciamo più facilmente ad aggrapparci al sei politico, anzi in questo caso al sette. Insomma, è vero che il valore atteso è un singolo numero che ci dà un’idea di cosa sta succedendo, ma non possiamo usarlo bovinamente in ogni occasione; dobbiamo prima capire cosa vogliamo davvero dalla vita.

Post Scriptum: sarebbe interessante, e magari una volta o l’altra ci provo, a vedere che succede nel caso in cui si è certi di 30 risposte su 50, occorre fare 25 punti, e per le altre 20 domande si può decidere se non rispondere o scegliere a caso tra tre risposte dopo avere eliminato la quarta (gli altri due casi sono banali: salvo fluttuazioni statistiche dovrebbe convenire rispondere al minimo numero possibile di domande se il valore atteso è negativo, e a tutte le domande se invece è positivo).

Un’altra estensione al problema consiste nell’avere domande con un numero di risposte sensate differenti. L’analisi sembra complicarsi molto; ma in realtà la si può semplificare notando come se voglio rispondere a una sola domanda tra due è meglio provare con quella che mi dà le maggiori probabilità di vincita. Pertanto se le scelte tra le quattro domande mancanti nell’esempio originale fossero 4,3,2,3 allora conviene ordinarle 2,3,3,4 e fare l’analisi come prima. Morale: prima di mettersi a fare i conti brutali, anche se si ha un calcolatore a disposizione, è sempre meglio un controllo teorico!