Le prime sequenze del coronavirus, ritrovate

Erano state caricate su un archivio online e poi misteriosamente rimosse: chi le ha scoperte ritiene forniscano nuovi indizi su come iniziò la pandemia

 (AP Photo/Ng Han Guan)
(AP Photo/Ng Han Guan)

Consultando alcuni salvataggi online di backup, un ricercatore dice di avere recuperato alcune delle prime sequenze del coronavirus (SARS-CoV-2), che erano state cancellate da uno dei principali archivi utilizzati per condividerle con la comunità scientifica. Jesse Bloom, il virologo autore del ritrovamento, ritiene che i nuovi dati possano offrire qualche spunto in più su quando e come avvenne lo spillover, cioè il passaggio del coronavirus da un pipistrello o un altro animale verso gli esseri umani.

Nella sua analisi, per ora pubblicata in forma preliminare e quindi da prendere con qualche cautela, Bloom scrive che la scoperta indica che la Cina avesse qualcosa da nascondere alla fine del 2019 circa l’origine del coronavirus, che secondo alcuni si sarebbe diffuso da un laboratorio di Wuhan, la città cinese in cui iniziò la pandemia. Per altri ricercatori, invece, il lavoro di Bloom non porta nuove prove anche perché gli stessi dati rimossi furono poi diffusi sotto altra forma dai ricercatori cinesi.

La nuova ricerca porta comunque nuovi elementi al dibattito su come il coronavirus si diffuse in Cina alla fine del 2019, con ipotesi sul fatto che il virus fosse in circolazione a Wuhan ancora prima dei casi riscontrati presso un mercato locale di animali vivi.

Dopo alcune settimane di indagini, lo scorso marzo una commissione dell’Organizzazione mondiale della sanità (OMS) aveva diffuso gli esiti di un’indagine condotta in Cina, che aveva indicato come “estremamente improbabile” il fatto che l’attuale coronavirus fosse derivato da attività di laboratorio. Le conclusioni avevano suscitato non poche perplessità tra i ricercatori, soprattutto perché il governo cinese aveva impedito agli ispettori dell’OMS di consultare liberamente alcuni documenti, prodotti dall’Istituto di virologia di Wuhan, dove da tempo si effettuavano ricerche sui coronavirus.

All’epoca, Bloom aveva firmato insieme ad altri 17 ricercatori una lettera aperta che aveva criticato il lavoro dell’OMS soprattutto per avere liquidato, senza molti approfondimenti, l’ipotesi di un legame tra la pandemia e i laboratori di Wuhan. Gli ispettori dell’OMS si erano del resto basati in buona parte sulle sequenze del materiale genetico di SARS-CoV-2 isolate dai pazienti malati di COVID-19 che avevano frequentato il mercato di Wuhan, o che avevano avuto contatti con alcuni suoi clienti, senza prendere molto in considerazione l’eventualità di altri contagi avvenuti prima.

Le sequenze genetiche, cioè le informazioni sul materiale genetico dei campioni virali, contengono indizi importanti per capire come un virus sia passato da una specie a un’altra. Le più rilevanti sono quelle che risalgono alle prime fasi della pandemia, perché dovrebbero consentire ai ricercatori di avvicinarsi il più possibile al momento in cui avvenne lo spillover.

Bloom si stava dedicando all’analisi delle informazioni genetiche pubblicate da diversi ricercatori, quando incappò in uno studio pubblicato a marzo del 2020 che comprendeva informazioni su circa 240 sequenze genetiche, messe insieme da alcuni ricercatori dell’Università di Wuhan. Il documento segnalava che le sequenze complete fossero state caricate online su Sequence Read Archive (SRA), un archivio gestito dal governo degli Stati Uniti. Bloom provò a cercarle scoprendo in questo modo che erano state rimosse.

Si mise allora a fare una revisione più accurata della ricerca e dei suoi autori, arrivando a un altro studio che era stato pubblicato online sempre a marzo del 2020, e tre mesi dopo su una rivista scientifica. Questo secondo studio indicava di avere analizzato 45 campioni prelevati tramite tampone nasale da altrettanti individui con una sospetta infezione da coronavirus, nelle primissime fasi dell’epidemia. Lo studio mostrava solo alcune parti delle sequenze genetiche, quelle legate ad alcune mutazioni, ma Bloom notò alcune corrispondenze con le sequenze scomparse da SRA.

Analizzando il modo in cui funziona l’archivio online, Bloom è in seguito riuscito a recuperare 13 delle circa 240 sequenze sparite da SRA. Le ha poi studiate e combinate con altre sequenze, per cercare di arricchire l’albero genealogico delle prime versioni di SARS-CoV-2, un lavoro complicato perché i campioni noti e utilizzabili per le ricerche dalla prima fase dell’epidemia sono pochi.

I campioni di coronavirus isolati dal mercato di Wuhan presentavano tre mutazioni in più rispetto a quelli raccolti alcune settimane dopo altrove, e più simili ai coronavirus trovati nei pipistrelli. Questa circostanza sembrava indicare che la fonte del contagio non fosse il mercato di Wuhan. Le sequenze che ha recuperato Bloom sono prive delle mutazioni aggiuntive e sembrano confermare l’ipotesi che quando il coronavirus arrivò al mercato fosse già in circolazione da un pezzo in città e forse anche altrove.

Nella sua ricerca, Bloom ammette comunque che saranno necessarie nuove e più approfondite analisi per confermare la sua ipotesi, anche perché ci sono ancora molti aspetti da chiarire.

Non è per esempio chiaro perché i ricercatori cinesi decisero di eliminare le sequenze da SRA. Bloom ha detto di essersi messo in contatto con i ricercatori cinesi che richiesero la rimozione da SRA dei dati, ma di non avere ricevuto risposta. I responsabili di NIH hanno invece detto che le sequenze vengono rimosse su richiesta dei ricercatori che le hanno pubblicate nel caso in cui emergano nuovi dettagli, la necessità di fare correzioni o di evitare che siano in circolazione versioni discordanti. Bloom dice però di non avere trovato le sequenze in nessuno degli altri archivi che forniscono servizi simili.

Il lavoro di Bloom conferma quanto fossero inevitabilmente incerte e confuse le prime attività di ricerca intorno al nuovo coronavirus, ma non fornisce molti elementi in più a sostegno dell’ipotesi dell’origine da un laboratorio della pandemia. Diversi ricercatori hanno segnalato che lo studio cinese da cui è partito Bloom era stato presentato per la pubblicazione prima che fosse richiesta la rimozione dei dati da SRA. Appare quindi difficile che il gruppo di lavoro stesse cercando di nascondere qualcosa, anche perché se avesse voluto farlo avrebbe rinunciato a proporre la pubblicazione della sua ricerca.

Bloom ha comunque dimostrato che per alcuni archivi si possono recuperare dati poi rimossi e questo potrebbe offrire nuovi spunti nello studio delle prime attività di ricerca, e di sequenziamento, intorno al coronavirus emerso alla fine del 2019. La ricerca conferma inoltre la necessità di approfondire ulteriormente l’origine del coronavirus, come del resto chiesto dalla stessa Organizzazione mondiale della sanità (OMS) e dal presidente degli Stati Uniti, Joe Biden, che a fine maggio ha ordinato alle agenzie di intelligence del paese di «aumentare i loro sforzi» per scoprire come sia iniziata l’attuale pandemia.