La ChatGpt del Dna per trovare mutazioni pericolose e terapie su misura

Si apre una nuova era per la biologia con Evo2 , il più potente modello di intelligenza artificiale generativa applicato alla genetica . E' una sorta di ChatGpt addestrato a comprendere il Dna piuttosto che il linguaggio umano: può analizzare e riscrivere intere sequenze di codice genetico , identificare mutazioni all'origine di malattie e progettare nuovi genomi (lunghi quanto quelli di semplici batteri ). Istruito con 9 mila miliardi di 'lettere' del Dna (nucleotidi) provenienti da 128mila genomi di specie diverse , vive ed estinte , è stato sviluppato dall'Arc Institute e da Nvidia, insieme alla Stanford University e all'Università della California a Berkeley e San Francisco. Il risultato del loro lavoro, rilasciato un anno fa, è ora pubblicato anche sulla rivista Nature.

Se il modello precedente Evo 1 (presentato nel 2024) era stato addestrato interamente su genomi di organismi unicellulari , Evo 2 si basa anche su genomi di organismi pluricellulari , compresi esseri umani e piante . In questo modo può elaborare sequenze genetiche fino a 1 milione di nucleotidi contemporaneamente , arrivando a comprendere anche le relazioni nascoste che intercorrono tra parti distanti di un genoma .

"Il nostro sviluppo di Evo 1 ed Evo 2 rappresenta un momento chiave nel campo emergente della biologia generativa , perché ha permesso alle macchine di leggere, scrivere e pensare nel linguaggio dei nucleotidi ", osserva Patrick Hsu, co-fondatore dell'Arc Institute. "Evo 2 ha una comprensione generalista dell'albero della vita che è utile per una moltitudine di compiti , dalla previsione di mutazioni che causano malattie alla progettazione di potenziali codici per la vita artificiale ".

Evo2 mostra già una versatilità sufficiente a identificare i cambiamenti genetici che influenzano la funzione delle proteine : ad esempio, nei test con varianti del gene Brca1 associato al tumore del seno , Evo 2 ha raggiunto un' accuratezza superiore al 90% nel predire le mutazioni benigne rispetto a quelle potenzialmente pericolose . Intuizioni come queste potrebbero far risparmiare ore di lavoro e fondi per la ricerca necessari per condurre esperimenti su cellule o animali, individuando le cause genetiche delle malattie umane e accelerando lo sviluppo di nuovi farmaci e terapie geniche mirate con minori effetti collaterali.

Si tratta dunque di uno strumento potentissimo che si inserisce in un percorso nato dalle scoperte sull' editing genetico (la tecnica Crispr che è valsa il Premio Nobel per la chimica 2020 a Emmanuelle Charpentier e Jennifer Doudna ) e proseguito poi con AlphaFold , l'Ia di Google capace di prevedere la struttura tridimensionale delle proteine e di crearne di nuove, non presenti in natura. Evo 2 estende ulteriormente queste capacità e trova applicazione in molti nuovi settori , come la progettazione di sequenze genetiche inedite , l 'interpretazione di frammenti di Dna di cui è difficile capire la funzione, e ancora lo studio della genesi di malattie ereditarie . Un esempio delle sue potenzialità era stato mostrato nel settembre 2024, quando il gruppo di ricerca guidato da Brian Hie dell'Università di Stanford aveva usato Evo 2 per realizzare per la prima volta un intero virus in laboratorio . Potenzialità senza precedenti che proprio per questioni etiche sono state limitate , impedendo a Evo 2 di modificare o progettare organismi potenzialmente pericolosi .

© RIPRODUZIONE RISERVATA