Un mondo di numeri

Questo blog parlerà di numeri: numeri nel senso di matematica, ma sopratutto nel senso di dati. In sé, “dato” è un termine molto generico; per esempio, ci può essere molta differenza nell’impegno richiesto per generarlo: a un estremo dello spettro, dati estremamente curati, manciate di numeri che costituiscono il risultato di anni di lavoro di migliaia di persone; all’altro estremo, e sempre più in quantità, dati a buon mercato, magari prodotti in massa da sensori distribuiti lungo le nostre strade, o nelle nostre tasche. Per non parlare di dati creati a partire da simulazioni con lo scopo di mimare più economicamente dei processi reali.

Molti dei lavori creati negli ultimi anni hanno come scopo la produzione di dati di massa, di sempre nuovi tipi. Tuttavia, più i dati tendono al secondo estremo dello spettro e meno sono direttamente intellegibili e utili. Il semplice volume è troppo grande per poter essere gestito da un essere umano, e inoltre compaiono problemi sistematici: per esempio, aumenta il “rumore”, cioè gli errori e i campioni non rilevanti che si insinuano tra i dati. Un altro gruppo di lavori ha precisamente come scopo quello di spingere i dati verso il primo estremo, riducendone la dimensione, ma incrementandone l’utilità.

Nel mio piccolo, lo scopo che mi propongo in questo blog è di mostrare alcuni esempi di questi processi, usando un po’ di matematica e informatica per generare o raccogliere i dati iniziali, e per trasformarli in qualcosa di… utile? No, non è questo lo scopo, ma spero che possano diventare interessanti e qualche volta pure inaspettati.

Stefano Maggiolo

(Non più?) matematico, non esattamente informatico, ora lavora come ingegnere del software a Google Londra. Gli piace giocare con i dati: raccoglierli o crearli, trasformarli, e sintetizzarli in qualcosa di sorprendentemente ancora inutile, ma divertendosi nel processo.