Un puzzle quasi completo: il nostro genoma

Condividi su facebook
Facebook
Condividi su linkedin
LinkedIn
Condividi su whatsapp
WhatsApp
Condividi su email
Email
Sintesi
Solo agli inizi degli anni 2000 furono pubblicati i primi risultati del sequenziamento del genoma umano. Tali risultati mancavano di una parte del genoma: circa l’8%. La sfida, infatti, da quell’anno in poi fu cercare di costruire il puzzle più difficile di tutti i tempi: il nostro genoma. Nel 2021, il consorzio Telomere-to-Telomere (T2T), ha aggiunto parti al genoma lasciate incomplete e mai sequenziate. L’obiettivo è quindi quasi raggiunto, Mancano però anche dei pezzi per completare puzzle

Indice

È dagli anni ’70 che si cerca di ottenere l’intera sequenza nucleotidica del genoma umano utilizzando diverse metodologie. Solo agli inizi degli anni 2000 furono pubblicati i primi risultati del sequenziamento del genoma umano. Un’impresa scientifica straordinaria che ha cambiato il volto della medicina. Tali risultati però non racchiudevano l’intera sequenza, pare infatti che quella famosa bozza del 2001 aveva perso circa l’8% del genoma umano totale. La sfida, infatti, da quell’anno in poi fu perlappunto cercare di costruire il puzzle più difficile di tutti i tempi: il nostro genoma.

Take me back: cos’è il genoma? Da cosa è composto?

Il genoma è l’insieme del patrimonio genetico che caratterizza ogni essere vivente. Le indicazioni genetiche risiedono nella sequenza del DNA (https://www.infarmati.it/il-lato-oscuro-del-genoma-junkdna/) . La sequenza del DNA non è altro che l’alternarsi dei quattro nucleotidi che compongono la doppia elica. Si tratta quindi un codice dato dalla combinazione di unità dette nucleotidi. Ogni pezzetto del genoma, corrisponde ad un gene, con una precisa sequenza e una precisa funzione. Decifrare l’intero codice e cioè conoscere quindi l’intera sequenza del DNA, sarebbe utile per studiare concetti ancora oggi lasciati incompleti [1].

Perché non è completa la mappa del genoma umano?


La maggior parte dei dati di sequenziamento davano risultati per lo più di parti corrispondenti alla parte eucromatica del genoma umano (parte del genoma i cui geni codificano proteine). La parte restante del genoma, corrispondente alla parte non codificante, era difficile da catturare e sequenziare. Questo era dovuto anche ai limiti delle metodiche che fortunatamente nel corso del tempo sono cambiate e migliorate.

Metodi di sequenziamento

Agli inizi degli anni Settanta sono stati escogitati due diversi metodi per sequenziare il DNA, cioè determinare la sequenza delle basi (o nucleotidi). Il primo metodo è quello di Maxam e Gilbert: fu molto utilizzato inizialmente ma poi abbandonato in quanto prevedeva l’utilizzo di un radioattivo. Il secondo metodo, ancora oggi utilizzato è quello di Sanger. Con il passare degli anni però tale metodo è stato affinato e reso più accurato.

Per ottenere la sequenza quasi completa del genoma umano (Human Genome Project)si è impiegato circa dieci anni e si sono investiti molti soldi. Il solo pensiero, che oggi, per ottenere dati di un sequenziamento possano bastare anche meno di 24 ore fa capire quanto l’avvento di nuove tecnologie sia stato importante ed indispensabile.

L’NGS: next generation sequencing

Negli ultimi anni le metodologie e le piattaforme tecnologiche per il sequenziamento degli acidi nucleici hanno subito una straordinaria evoluzione. L’ introduzione delle piattaforme di sequenziamento di nuova generazione (NGS) ha prodotto un eccezionale aumento della capacità di sequenziamento, e cioè la capacità di sequenziare quanti più nucleotidi possibili in minor tempo in parallelo ad una drastica riduzione dei costi. Tra le piattaforme più diffuse ci sono: Illumina e Roche 454.

Le ultime tecnologie di sequenziamento, chiamate anche di terza generazione, superano di gran lunga le precedenti metodiche. Si parla infatti di sequenziamento tramite la Pacific biosciences e la Nanopore sequencing. La parte più interessante è che riescono a passare in queste macchine fino a 20.000 nucleotidi per essere sequenziati. Quindi si riducono di molto i tempi di sequenziamento[2].

8% mancante

Prima del 2021, quasi tutti i risultati di sequenziamento lasciavano scoperta una parte del genoma: circa l’8% corrispondente alla parte eterocromatica (quindi genoma non codificante)e a molte altre regioni complesse i cui dati di sequenziamento erano lasciati incompiuti o errati.

Il Consorzio di ricerca Telomere-to-Telomere (T2T) ha deciso di occuparsi dell’8% oscuro restante[3].

Il rilascio del primo assemblaggio del genoma umano è stato un traguardo storico e, dopo quasi due decenni di miglioramenti, l’attuale genoma di riferimento umano (GRCh38) è il genoma di vertebrati più accurato e completo mai prodotto. Tuttavia, nessun cromosoma è stato ancora terminato da un capo all’altro e centinaia di lacune persistono nel genoma.

Queste regioni includono duplicazioni segmentali, geni ribosomiali e regioni genomiche ripetute satelliti che ospitano zone inesplorate ed oscure.

L’obiettivo del Consorzio di ricerca Telomere-to-Telomere (T2T)  è completare queste regioni rimanenti e generare il primo assemblaggio veramente completo di un genoma umano, migliorando le tecnologie a disposizione.

I ricercatori appartenenti al consorzio, infatti, affermano che questo 8% del genoma non è stato trascurato per la sua scarsa importanza, ma piuttosto per i limiti tecnologici. Il sequenziamento a lettura lunga ad alta precisione ha finalmente rimosso questa barriera tecnologica, consentendo studi completi della variazione genomica attraverso l’intero genoma umano.

Obiettivo quasi raggiunto

Nel 2021, tale consorzio ha finalmente raggiunto parte del loro obiettivo, aggiungendo un altro pezzo al puzzle genomico.

Il consorzio di ricerca ha terminato la prima sequenza veramente completa di 3.055 miliardi di coppie di basi (bp) di genoma umano, che rappresenta il più grande miglioramento del genoma di riferimento umano dalla sua versione iniziale. Il nuovo riferimento T2T-CHM13 include nuove sequenze per tutti i 22 cromosomi autosomi più il cromosoma X, corregge numerosi errori e introduce quasi 200 milioni di bp alle precedenti sequenze finora pubblicate contenenti anche 115 geni dei quali si prevede che siano codificanti proteine[4].

Tali ricerche sbloccano complesse regioni del genoma per la prima volta a studi variazionali e funzionali. Cosa ci riserveranno queste nuove sequenze? Si riuscirà a rispondere a concetti lasciati incompleti o apriranno nuovi dubbi e domande?

Intanto…

Non è finita qui! All’appello mancherebbe ancora parte del cromosoma Y. il cromosoma Y umano è noto per essere eterocromatico e altamente ripetitivo. Ma i ricercatori non sono di certo spaventati, accolgono con piacere la sfida puntando su tecnologie all’avanguardia che consentiranno al completamento della mappa genomica umana.

Ma chi lo dice che sarà finita? Ci saranno altre parti oscure che il nostro genoma nasconde?

Quando nulla è certo, tutto è possibile”


[1] Giuseppina Guarino, Il lato oscuro del genoma umano, infarmati.it

[2] Amaldi, Biologia molecolare, Ambrosiana

[3] T2T consortium https://sites.google.com/ucsc.edu/t2tworkinggroup/home?authuser=0

[4] Nurk et al, 2021, The complete sequence of a human genome, biorXiv

Condividi su facebook
Facebook
Condividi su linkedin
LinkedIn
Condividi su whatsapp
WhatsApp
Condividi su email
Email