L'intelligenza artificiale (AI) ha creato nuove possibilità di progettare proteine su misura per risolvere qualsiasi problema, da quelli medici a quelli ecologici. Guardiamo un innovativo modello deep di linguaggio non supervisionato per la progettazione di proteine, ProtGPT2, appena presentato, che consente di progettare e realizzare proteine con l'ausilio dell'AI mediante il linguaggio naturale.
Un gruppo di ricerca dell'Università di Bayreuth, guidato dalla Prof.ssa Birte Höcker, ha ora applicato con successo un modello di elaborazione del linguaggio naturale basato su computer alla ricerca sulle proteine. In modo completamente indipendente, il modello ProtGPT2 progetta nuove proteine in grado di ripiegarsi in modo stabile e di assumere funzioni definite in contesti molecolari più ampi. Il modello e il suo potenziale sono illustrati scientificamente in Nature Communications.
Le lingue naturali e le proteine hanno una struttura simile. Gli amminoacidi si dispongono in una moltitudine di combinazioni per formare strutture che hanno funzioni specifiche nell'organismo vivente, analogamente al modo in cui le parole formano frasi in diverse combinazioni che esprimono determinati fatti. Negli ultimi anni sono stati quindi sviluppati numerosi approcci per utilizzare i principi e i processi che controllano l'elaborazione assistita da computer del linguaggio naturale nella ricerca sulle proteine. "L'elaborazione del linguaggio naturale ha compiuto progressi straordinari grazie alle nuove tecnologie di intelligenza artificiale. Oggi i modelli di elaborazione del linguaggio consentono alle macchine non solo di comprendere frasi significative, ma anche di generarle da sole. Questo modello è stato il punto di partenza della nostra ricerca. Con informazioni dettagliate su circa 50 milioni di sequenze di proteine naturali, la mia collega Noelia Ferruz ha addestrato il modello e lo ha messo in grado di generare autonomamente sequenze di proteine. Ora comprende il linguaggio delle proteine e può usarlo in modo creativo. Abbiamo scoperto che questi progetti creativi seguono i principi di base delle proteine naturali", afferma la prof.ssa Birte Höcker, responsabile del gruppo di progettazione delle proteine dell'Università di Bayreuth.
Il modello di elaborazione linguistica trasferito all'evoluzione delle proteine si chiama ProtGPT2. Ora può essere utilizzato per progettare proteine che adottano strutture stabili attraverso il ripiegamento e sono permanentemente funzionali in questo stato. Inoltre, i biochimici di Bayreuth hanno scoperto, attraverso complesse indagini, che il modello può persino creare proteine che non sono presenti in natura e che forse non sono mai esistite nella storia dell'evoluzione. Queste scoperte fanno luce sull'incommensurabile mondo delle proteine possibili e aprono la strada alla loro progettazione in modi nuovi e inesplorati. C'è un ulteriore vantaggio: La maggior parte delle proteine progettate de novo finora ha strutture idealizzate. Prima che tali strutture possano avere un'applicazione potenziale, di solito devono passare attraverso un elaborato processo di funzionalizzazione - ad esempio inserendo estensioni e cavità - in modo da poter interagire con il loro ambiente e assumere funzioni precisamente definite in contesti di sistema più ampi. ProtGPT2, invece, genera proteine che hanno già strutture differenziate e sono quindi già operative nei rispettivi ambienti.
La prof.ssa Birte Höcker in un laboratorio di biochimica nel campus di Bayreuth. Credito: UBT / Christian Wißler
"Il nostro nuovo modello è un'altra impressionante dimostrazione dell'affinità sistemica tra la progettazione di proteine e l'elaborazione del linguaggio naturale. L'intelligenza artificiale apre possibilità molto interessanti e promettenti di utilizzare i metodi di elaborazione del linguaggio per la produzione di proteine personalizzate". All'Università di Bayreuth speriamo di contribuire in questo modo allo sviluppo di soluzioni innovative per problemi biomedici, farmaceutici ed ecologici", afferma la prof.ssa Birte Höcker.
Ottimo. Grazie della informazione...