Perché ieri Facebook è morto

Il social network è rimasto irraggiungibile per quasi tre ore, il peggiore periodo di down degli ultimi quattro anni

Ieri notte, per circa tre ore le decine di milioni di utenti che affollano Facebook non sono riusciti a usarlo. A causa di un problema tecnico, il social network è rimasto offline tra le 20,30 e le 23 italiane, senza fornire particolari informazioni ai propri iscritti che cercavano di accedere al portale. Rimettere le cose a posto ha richiesto più tempo del previsto e i responsabili di Facebook ammettono di aver affrontato uno dei peggiori malfunzionamenti da quanto esiste il social network.

Le spiegazioni su quanto accaduto sono arrivate dopo alcune ore, quando il sito web era nuovamente funzionante, ma non attraverso il blog ufficiale di Facebook sul quale non sono state pubblicate informazioni sull’accaduto. In una delle pagine del social network, il responsabile dell’area sviluppo software, Robert Johnson, ha spiegato che il lungo periodo di down è stato causato dalla scorretta gestione di alcuni dati da parte di un sistema automatico di controllo.

In condizioni normali, il sistema automatico provvede a verificare alcuni valori di configurazione presenti nella memoria temporanea del social network (cache) e a sostituirli con altri dati nel caso in cui le informazioni siano ritenute scorrette. Poco prima che Facebook finisse offline, i tecnici avevano apportato alcune correzioni al sistema, che il servizio automatico di controllo ha interpretato come scorrette. La scorretta interpretazione si è spalmata a cascata sulle macchine che gestiscono Facebook, sovraccaricando infine il sistema.

Arrestare la cascata di errori, spiega sempre Johnson, non è stato semplice perché non era sufficiente correggere il problema all’origine per risolvere il problema. L’unica soluzione possibile si è rivelata la più drastica: mettere offline parte del social network per risolvere il problema e poi riavviare progressivamente i sistemi per consentire agli utenti di riutilizzare Facebook.

Dopo alcune ore di lavoro, il social network è tornato online, ma per precauzione il sistema di controllo automatico è stato sospeso in attesa di soluzioni più efficaci. Gestire l’enorme mole di dati generata ogni giorno da centinaia di milioni di utenti non è semplice, dunque un periodo offline può sempre capitare, anche se in molti hanno lamentato la mancanza di informazioni da parte del social network nelle ore in cui è rimasto offline.

Negli ultimi quattro anni Facebook ha comunque mantenuto una buona media, nonostante la grande quantità di traffico che genera, finendo offline poche volte e in genere per periodi di tempo limitati e forse per questo motivo non sono molto attrezzati sul fronte della comunicazione per i momenti di down. Altri siti web in casi simili offrono informazioni agli utenti attraverso i blog di supporto o con altri sistemi di informazione online. Twitter ha una lunga esperienza in merito: il social network è diventato celebre per i suoi numerosi periodi offline (quelli con la balena) dovuti a problemi tecnici e all’instabilità della piattaforma. Negli ultimi mesi si sono registrati comunque dei progressi e i responsabili di Twitter mantengono costantemente aggiornati i loro utenti attraverso il blog della società e un sito appositamente dedicato allo stato di salute del social network.

Facebook raccoglie comunque un numero molto più alto di utenti, circa mezzo miliardo di iscritti. Il social network si è affidato per anni a società esterne per i computer e i server che animano il proprio portale. A gennaio è stato annunciato l’avvio della costruzione di un nuovo data center su misura in Oregon (Stati Uniti) gestito direttamente da Facebook.