Annunciato l'Atlante metagenomico ESM: la prima visione della "materia oscura" dell'universo proteico. Meta AI ha creato il primo database che rivela le strutture del mondo metagenomico su scala di centinaia di milioni di proteine. Queste proteine - che si trovano nei microbi del suolo, nelle profondità dell'oceano e persino all'interno del nostro corpo - superano di gran lunga quelle che compongono la vita animale e vegetale. Ma sono le proteine meno conosciute sulla terra. La decodifica delle strutture metagenomiche può aiutarci a risolvere misteri di lunga data della storia evolutiva e a scoprire proteine che possono aiutare a curare le malattie, a ripulire l'ambiente e a produrre energia più pulita. Vediamo di cosa si tratta.
Con un post su Facebook oggi Mark Zuckerberg ha annunciato un nuovo breakthrough per le AI di Meta:
Le proteine sono molecole complesse e dinamiche, codificate dai nostri geni, responsabili di molti dei vari e fondamentali processi della vita. Il loro ruolo in biologia è sorprendente. I bastoncelli e i coni dei nostri occhi che percepiscono la luce e ci permettono di vedere, i sensori molecolari alla base dell'udito e del tatto, le complesse macchine molecolari che convertono la luce solare in energia chimica nelle piante, i motori che guidano il movimento nei microbi e nei nostri muscoli, gli enzimi che decompongono la plastica, gli anticorpi che ci proteggono dalle malattie e i circuiti molecolari che causano malattie quando falliscono, sono tutte proteine.
La metagenomica, una delle nuove frontiere delle scienze naturali, utilizza il sequenziamento dei geni per scoprire le proteine in campioni provenienti da ambienti di tutta la Terra, dai microbi che vivono nel suolo, nelle profondità dell'oceano, in ambienti estremi come le bocche idrotermali e persino nel nostro intestino e sulla nostra pelle. Il mondo naturale contiene un vasto numero di proteine oltre a quelle catalogate e annotate negli organismi ben studiati. La metagenomica sta iniziando a rivelare l'incredibile ampiezza e diversità di queste proteine, scoprendo miliardi di sequenze proteiche nuove per la scienza e catalogate per la prima volta in grandi database compilati da iniziative pubbliche come l'NCBI, l'Istituto europeo di bioinformatica e il Joint Genome Institute, che incorporano studi di una comunità mondiale di ricercatori.
Meta AI ha sviluppato un nuovo approccio al ripiegamento delle proteine che sfrutta modelli linguistici di grandi dimensioni per creare la prima visione completa delle strutture delle proteine in un database metagenomico su scala di centinaia di milioni di proteine. I ricercatori di Meta AI hanno utilizzato un modello di intelligenza artificiale per prevedere le strutture molecolari delle proteine di virus, batteri e altri microbi. L'azienda ha poi condiviso un database creato con oltre 617 milioni di strutture "metagenomiche" di proteine, i mattoni della vita.
La metagenomica si riferisce allo studio del materiale genetico degli organismi, di solito microbi, come i batteri presenti sulla nostra pelle, nell'oceano o nel suolo.
Meta afferma che i dati potrebbero aiutare gli scienziati a trovare nuovi modi per ripulire l'ambiente, scoprire nuovi farmaci e generare energia rinnovabile, tra gli altri progressi. Per prevedere le strutture proteiche del mondo metagenomico, i ricercatori di Meta hanno innanzitutto addestrato un modello di intelligenza artificiale sulle sequenze di proteine conosciute, insegnando al modello a "completare automaticamente" le proteine quando mancano alcuni aminoacidi.
Il modello ha acquisito una comprensione innata delle sequenze proteiche. Ispirandosi all'AI AlphaFold di DeepMind, Meta ha poi combinato questa comprensione con le informazioni sulle strutture e le sequenze proteiche note.
Cosa può scaturire da questa innovazione?
I progressi nel sequenziamento dei geni hanno reso possibile la catalogazione di miliardi di sequenze di proteine metagenomiche. Sebbene sappiamo che queste proteine esistono, perché abbiamo scoperto le loro sequenze, la comprensione della loro biologia è una sfida sbalorditiva. Determinare sperimentalmente le strutture tridimensionali di centinaia di milioni di proteine è ben al di là della portata di tecniche di laboratorio che richiedono molto tempo, come la cristallografia a raggi X, che può richiedere settimane o anni per una singola proteina. Gli approcci computazionali possono darci una visione delle proteine metagenomiche che non è possibile con le tecniche sperimentali.
L'atlante metagenomico ESM consentirà agli scienziati di ricercare e analizzare le strutture delle proteine metagenomiche su scala di centinaia di milioni di proteine. Questo può aiutare i ricercatori a identificare strutture che non sono state caratterizzate prima, a cercare relazioni evolutive lontane e a scoprire nuove proteine che possono essere utili in medicina e in altre applicazioni.
Il risultato è stata la rete ESMFold, che secondo Meta è circa 60 volte più veloce di AlphaFold nel predire le strutture proteiche, anche se meno precisa.
Il database delle strutture, chiamato Atlante metagenomico ESM, è ora disponibile online. e un paper scientifico sulla soluzione è in fase di pre-pubblicazione.
Meta ha anche rilasciato il codice di base del modello, un documento di ricerca e un'API per trovare strutture proteiche specifiche durante la ricerca scientifica.
AlphaFold nel suo lavoro aveva già raggiunto alcuni standard. DeepMind, società di proprietà di Alphabet, ha utilizzato il suo algoritmo AlphaFold per prevedere la forma di quasi tutte le proteine conosciute sulla Terra.
Il laboratorio di AlphaFold ha poi compilato un database liberamente disponibile di oltre 200 milioni di strutture proteiche, comprese quelle prodotte da animali, piante, batteri e funghi.
Il cofondatore di DeepMind Demis Hassabis e lo scienziato ricercatore John Jumper hanno recentemente vinto un Breakthrough Prize da 3 milioni di dollari per lo sviluppo del programma di intelligenza artificiale.
Alcune domande rimangono
Questi nuovi strumenti sono un contributo di Meta alla scienza, libera e aperta o la ricerca, dopo i fallimentari risultati sul metaverso, di nuovi settori per il business, come healthcare e ricerca scientifica, dove magari trovare anche applicazione per i suoi devices Oculus?
La velocità raggiunta è impressionante. Questo viene a scapito della precisione. Quanto questo può costare in termini di ricerca e investimenti pubblici? Intuizioni sbagliate possono portare ad anni di ricerche inutili e spese di fondi pubblici enormi come nel celebre caso dell'Alzheimer. Insomma, mai come oggi non sembra poterci essere scienza o tecnologia senza la definizione di un campo etico che l'accompagni. Anche in questo caso serve un'algoretica.
Comments