Un nou model de inteligență artificială poate scrie noi formule pentru proteine care nu apar în mod natural în natură. Experții folosesc noul model, numit ESM3, pentru a crea o proteină fluorescentă.
Un model AI a creat proteine „care nu se găsesc în natură”. Cum e posibil „momentul ChatGPT pentru biologie”
Un model AI a creat proteine „care nu se găsesc în natură”, după ce a fost elaborat de foști angajați Meta.
Doar 58% din secvența acestei proteine poate să apară în mod natural în alte proteine fluorescente, scrie Live Science.
Studiul a fost publicat recent în baza de date bioRxiv.
Un model AI a creat proteine „care nu se găsesc în natură”
La fel cum ChatGPT generează text prin predicţii cu privire la cele mai probabile cuvinte care urmează într-o propoziţie, un nou model de inteligenţă artificială poate genera noi proteine „care nu există în natură”, conform unui material publicat de Live Science, scrie AGERPRES.
Acest nou model AI ce a creat proteine inedite e un pas important în sectorul biologiei. Studiul a fost realizat de cercetători de la EvolutionaryScale. Aceasta e o companie formată de foşti cercetători din cadrul Meta.
Echipa de cercetare a lansat o versiune redusă a modelului sub o licenţă noncomercială. Va face varianta completă să fie disponibilă pentru cercetători în scopuri comerciale. Conform EvolutionaryScale, tehnologia poate fi folosită în diverse domenii. De la descoperirea drogurilor, la conceperea unor noi substanţe chimice pentru degradarea plasticului.
ESM3 este un model mare de limbaj (LLM) similar cu GPT-4 aparţinând OpenAI. Oamenii de ştiinţă au antrenat versiunea sa completă pe 2.78 miliarde de proteine. Pentru fiecare proteină, ei au extras informaţii cu privire la secvenţă (ordinea în care sunt dispuşi aminoacizii care compun proteina), structură (forma 3D a proteinei) şi funcţia ei. Apoi, aleatoriu, au extras părţi din aceste informaţii şi au solicitat modelului ESM3 să prezică părţile lipsă pentru acest nou model AI ce a creat proteine inedite, un avans important în tehnologia inteligenței artificiale.
Cercetătorii au precizat însă că acest model are limitări şi că predicțiile de proteine pe care le face necesită verificare. Dar chiar şi aşa, folosirea unui astfel de model AI poate accelera masiv căutarea de noi structuri proteice. Pentru că alternativa ar fi folosirea razelor X pentru a cartografia structurile proteinelor una câte una. Ceea ce este prea lent şi costisitor.
Modelul a generat deja 96 de proteine
ESM3 poate însă să asambleze şi proteine care nu există în natură. Folosind informaţia obţinută de la 771 de miliarde de date unice cu privire la structură, funcţie şi secvenţă, modelul poate genera noi proteine cu anumite funcţii.
În noul studiu, modelul a generat o nouă proteină fluorescentă. Acesta e un tip de proteină care captează lumina şi o emite apoi pe o lungime de undă mai mare. Ceea ce o face să strălucească într-o nouă nuanţă de verde. Acesta e un avans important pentru biologi, care ataşează proteinele de moleculele pe care le studiază, pentru a le putea urmări, cu ajutorul acestui nou model AI care a creat proteine inedite.
Modelul a generat 96 de proteine cu secvenţe şi structuri care le-ar permite să producă fluorescenţă. Apoi cercetătorii au ales o proteină care are cele mai puţine secvenţe în comun cu proteinele fluorescente din natură.
Deşi această proteină este de 50 de ori mai puţin strălucitoare decât proteinele verde fluorescent naturale, ESM3 a generat o altă variantă cu noi secvenţe care a dus la o creştere a strălucirii sale – iar rezultatul a fost o proteină verde fluorescentă care nu se mai găseşte în natură, denumită „esmGPF”. Astfel de variante create de AI ar avea nevoie de 500 de milioane de ani pentru a fi obţinute natural, prin evoluţie, conform unei estimări a echipei EvolutionaryScale.