Crispr, un algoritmo ha scoperto quasi 200 nuovi sistemi

Crispr-cas9 è stata una delle grandi scoperte degli ultimi decenni. Una scoperta da Nobel, che ha rivoluzionato il mondo dell’ingegneria genetica, e si appresta a fare altrettanto con quello della medicina: è di queste settimane, infatti, la notizia dell’approvazione – che vede in questo caso il Regno Unito apripista – della prima terapia genica (ex vivo, cioè un trapianto di cellule modificate geneticamente) basata su Crispr, che dovrebbe aiutare i pazienti colpiti dalle forme più gravi di anemia falciforme e betatalassemia. Mentre questa tecnologia si fa ormai sempre più matura, uno dei suoi pionieri, il biochimico Feng Zhang del Massachusetts Institute of Technology, continua invece a lavorare indefessamente per innovarla. La sua ultima fatica, appena pubblicata su Science, è un algoritmo che ha permesso di scovare quasi 200 nuovi sistemi Crispr mai identificati prima, molti dei quali sembrano già estremamente promettenti per applicazioni che vanno dalla diagnostica, all’editing genetico ad elevatissima precisione.

L’immunità batterica

L’evoluzione di Crispr-Cas9 in una tecnica di taglia e cuci genetico ha origini lontane, nella scoperta di una famiglia di brevi segmenti di Dna ripetuti all’interno del genoma di diversi tipi di batteri archei. Ribattezzate “clustered regularly interspaced short palindromic repeats”, e più note con l’acronimo Crispr, queste sequenze vennero riconosciute col tempo come un meccanismo di difesa importante con cui i batteri combattono i loro principali predatori: i virus noti come batteriofagi. Fondamentalmente, si tratta di meccanismi molecolari che permettono a questi organismi unicellulari di riconoscere il materiale genetico dei virus con cui entra in contatto, e di conferire questa capacità anche ai suoi discendenti. Lavorando di concerto con proteine come Cas9, questi sistemi sono in grado di riconoscere e distruggere i virus in vari modi, e rappresentano quindi un peculiare sistema di immunità acquisita ed ereditaria.

Bene, perché questa lunga premessa? Il fatto è che Crispr-Cas9 è solo uno dei sistemi Crispr esistenti, e più precisamente quello che grazie al lavoro dei due premi Nobel Emmanuelle Charpentier e Jennifer Doudna è stato modificato con successo fino a trasformarlo in un sistema con cui è possibile eliminare, modificare o inserire nel Dna praticamente qualunque sequenza genica. Di sistemi Crispr ne esistono quindi una molteplicità, nascosti nel Dna di milioni di batteri. E solo una frazione ad oggi è stata identificata, e studiata per testarne le potenzialità. È qui, ovviamente, che entra in gioco il nuovo lavoro di Feng Zhang, che come dicevamo è uno dei pionieri dello studio dei sistemi Crispr (tanto che in passato è rimasto invischiato nella battaglia per il brevetto di questa tecnologia miliardaria). Frustrati per la lentezza con cui precedevano le scoperte di nuove sequenze Crispr, Zhang e il suo gruppo di ricerca all’Mit hanno infatti deciso di prendere in prestito alcune delle tecniche utilizzate nello studio del big data, per sviluppare un algoritmo in grado di scoprirle da solo all’interno degli enormi database che raccolgono le sequenze di Dna batterico identificate dai ricercatori di tutto il mondo.

L’algoritmo

L’approccio scelto da Zhang e colleghi è mutuato dai metodi di analisi utilizzati per trovare somiglianze tra oggetti come immagini o brani musicali, per applicazioni come il data mining o il machine learning, e ha permesso ai ricercatori di analizzare in breve tempo miliardi di proteine e di sequenze geniche, concentrandosi sull’identificazione di sequenze simili associate ai sistemi Crispr, che potessero essere raggruppate tra loro. In questo modo, il lavoro di analisi è durato appena qualche settimana, mentre avrebbe richiesto mesi utilizzando tecniche di analisi più tradizionali. I 500 milioni di cluster (raggruppamenti) restituiti dall’algoritmo sono quindi stati studiati più a fondo, e alla fine i ricercatori si sono trovati tra le mani circa 130mila geni associati in qualche modo con i sistemi Crispr, di cui 188 non erano mai stati identificati in precedenza.

Non contenti, i ricercatori guidati da Zhang hanno deciso di sintetizzare e studiare alcuni dei nuovi sistemi Crispr nel loro laboratorio. La maggior parte appartengono alle sei categorie già note in precedenza, ma hanno caratteristiche uniche che li rendono promettenti candidati per future applicazioni pratiche. Un esempio sono diverse varianti del sistema catalogato come di “tipo 1”, composte da un Rna guida (la porzione che identifica il gene su cui va ad agire l’enzima Cas9) formato da 32 basi: 12 in più rispetto ai sistemi simili già noti. Essendo più lunga, la guida ha il potenziale di rivelarsi anche più precisa nell’identificare il suo bersaglio, se trasformata in uno strumento di editing genetico, riducendo il numero di modifiche “off target” (che possono provocare alterazioni indesiderate, e potenzialmente pericolose, in porzioni del Dna diverse da quelle scelte), uno dei problemi che si affrontano con le attuali tecnologie. Essendo comunque di lunghezza contenuta, i nuovi sistemi possono essere utilizzati con le stesse tecnologie sviluppate per Crispr-Cas9. Due di questi sono già stati sperimentati in vitro, dimostrando che possono effettivamente modificare breve porzioni di Dna.

Altri dei nuovi sistemi possiedono proprietà utili a scopo diagnostico (sono in grado di liberare il gene bersaglio dai filamenti di Dna, rendendolo facilmente identificabile). E uno appartiene invece a una nuova classe, che i ricercatori hanno battezzato di “tipo 7”, che ha come bersaglio non il Dna, ma l’Rna, e potrebbe quindi aprire le porte a una miriade di applicazioni completamente nuove per l’ingegneria genetica. Solo il tempo, chiaramente, ci dirà se qualcuna di queste scoperte troverà realmente applicazione in medicina, o in qualche altro campo. L’algoritmo sviluppato dai ricercatori del Mit comunque è di per sé un’invenzione di valore: può essere utilizzato da chiunque per cercare nuovi geni e proteine, anche non collegate ai sistemi Crispr.

Fonte : Wired