Il 31 marzo è stato annunciato e pubblicato sulla rivista Science il primo sequenziamento completo di un genoma umano, cioè l’esatta lettura dell’intero codice genetico di una persona. Un annuncio simile era già stato fatto una ventina di anni fa, nel 2003, quando il celebre Human Genome Project dichiarò terminato il suo lavoro: in realtà all’epoca il sequenziamento era quasi completo, arrivava al 92 per cento. L’8 per cento rimanente è stato sequenziato solo negli ultimi anni dal consorzio Telomere to Telomere (T2T) finanziato dal dipartimento della Salute degli Stati Uniti. Grazie a questo risultato sarà possibile studiare meglio i legami tra 622 geni e certe malattie.

Non tutto il DNA è ugualmente semplice da analizzare e le tecnologie disponibili nei primi anni Duemila non avevano permesso allo Human Genome Project di sequenziare interamente un genoma, che è fatto di circa 3 miliardi di basi azotate, le sostanze che costituiscono i “mattoncini” di cui sono fatti i geni e sono normalmente identificate con le lettere A, T, C e G. Da allora migliaia di ricercatori e ricercatrici hanno sviluppato nuovi strumenti di laboratorio e metodi computazionali: negli ultimi vent’anni sono stati una delle priorità della ricerca genetica e degli investimenti in questo ambito, con lo scopo di ridurre i costi del sequenziamento in generale e di ottenerne uno davvero completo.

Periodicamente la versione del genoma sequenziato nel 2003, nota come “sequenza di riferimento” e usata come confronto per studiare le mutazioni su alcuni geni di persone malate, veniva aggiornata con approssimazioni leggermente migliori. La più recente risaliva al 2013, ma aveva ancora quel buco corrispondente all’8 per cento del genoma.

Per questo nel 2019 il biologo computazionale Adam Phillippy e la genetista Karen Miga hanno fondato il consorzio Telomere to Telomere per completare il lavoro dello Human Genome Project: in totale hanno partecipato al progetto di ricerca 99 scienziate e scienziati che hanno lavorato direttamente sul sequenziamento, più decine di altri che hanno contribuito nell’interpretazione dei dati. Il New York Times ha raccontato che il lavoro è continuato a distanza nel corso della pandemia da coronavirus; il gruppo di lavoro comunicava attraverso l’app di messaggistica Slack.

La parte di genoma che mancava è fatta di circa 200 milioni di basi azotate, una quantità di DNA più o meno pari a quella che costituisce un cromosoma: i cromosomi sono i 46 pacchetti in cui sono raggruppati i geni umani, le porzioni di DNA che determinano le caratteristiche di un singolo individuo e prima ancora la sua appartenenza alla specie umana. Questa parte era distribuita su diversi cromosomi, in particolare nei telomeri, le parti terminali dei cromosomi, e nei centromeri, le parti centrali: sia gli uni che gli altri contengono sequenze ripetute di DNA e sono ancora poco conosciuti. Questo posizionamento era la ragione per cui era una delle parti di genoma più difficili da leggere.

Nelle nuove parti di DNA sequenziato sono stati scoperti circa duemila nuovi geni. La maggior parte non è codificante, cioè non genera la produzione di proteine: 99 però sembra che lo facciano e nei prossimi anni si farà ricerca per capire esattamente con che conseguenze. Secondo le conclusioni del consorzio T2T, il genoma umano contiene circa ventimila geni che codificano.

Ulteriori analisi della sequenza completa permetteranno di capire meglio come sono fatti e come funzionano i cromosomi, e come si dividono, ma anche cosa cambia nel DNA tra una persona e l’altra. Secondo Phillippy nei prossimi anni sequenziare interamente il genoma di una persona dovrebbe diventare più economico e semplice, rendendo più accessibile la ricerca di cure personalizzate.

