Vés al contingut

Aprenentatge automàtic profund completa la informació de bioactivitat d'un milió de molècules

Científiques
28 jun 21

Images

Participants

Imatge
Visiting Student
Tel.+34 93 40 39689

Contact

Imatge
Communication Officer
Tel.+34 93 40 37255

Una eina desenvolupada pel laboratori de Bioinformàtica Estructural i Biologia de Xarxes de l’IRB Barcelona prediu l'activitat biològica de compostos químics, una informació elemental per a valorar el seu potencial terapèutic.

Els científics han inferit, mitjançant unes xarxes neuronals artificials, les dades experimentals d'un milió de compostos i han desenvolupat un paquet de programes per a fer estimacions per a qualsevol mena de molècula.

El treball s'ha publicat en la revista Nature Communications.

El laboratori de Bioinformàtica Estructural i Biologia de Xarxes, liderat per l'Investigador ICREA Dr. Patrick Aloy, ha completat la informació de bioactivitat d'un milió de molècules mitjançant l'ús de models computacionals d'aprenentatge automàtic profund (deep machine learning). A més, ha fet pública una eina per a predir l'activitat biològica de qualsevol molècula, fins i tot quan no existeixen dades experimentals disponibles.

Aquesta nova metodologia es basa en el Chemical Checker, la major base de dades de perfils de bioactivitat per a pseudofàrmacs fins avui, desenvolupada pel mateix laboratori i publicada en 2020. El Chemical Checker recull informació de 25 espais de bioactivitat per a cada molècula, que tenen a veure amb la seva estructura química, les dianes amb les quals interacciona o els canvis que indueix a nivell clínic o cel·lular. No obstant això, aquesta informació tan detallada sobre el mecanisme d'acció és incompleta per a la majoria de molècules. És a dir, per a una d'elles pot haver-hi informació d'un o dos espais de bioactivitat, però no dels 25 possibles.

Amb aquest nou desenvolupament, els investigadors integren tota la informació experimental disponible amb mètodes d'aprenentatge automàtic profund, de manera que es poden completar tots els perfils d'activitat, des de la química fins a la clínica, per a totes les molècules.

“La nova eina també ens permet pronosticar els espais de bioactivitat de qualsevol molècula nova, i això és crucial en el procés de descobriment de fàrmacs, ja que podem fer una selecció dels candidats més adequats i descartar aquells que, per una raó o l'altra, no funcionarien”, explica el Dr. Aloy.

La biblioteca de programari és de lliure accés, està disponible per a la comunitat científica en bioactivitysignatures.org, i serà actualitzada periòdicament pels investigadors, a mesura que es disposi de més dades d'activitat biològica. Amb cada actualització de dades experimentals en el Chemical Checker, les xarxes neuronals artificials s'actualitzaran també per a anar perfeccionant les estimacions.

 

 

Prediccions i fiabilitat

Les dades de bioactivitat que prediu el model presenten un major o menor grau de fiabilitat en funció de diferents factors, com per exemple el volum de dades experimentals disponibles o les característiques de la molècula.

El sistema que ha desenvolupat l'equip liderat pel Dr. Aloy, a més de pronosticar aspectes de l'activitat a nivell biològic, proporciona el grau de fiabilitat de la predicció per cada molècula. “Tots els models són erronis, però alguns són útils! Una mesura de confiança ens permet interpretar millor els resultats i posar en relleu quins espais de bioactivitat d'una molècula són precisos, i en quins cal contemplar un percentatge d'error”, explica el Dr. Martino Bertoni, primer autor del treball.

 

Posar a prova el sistema amb la llibreria de compostos de l’IRB Barcelona

Per a validar l'eina, els investigadors han buscat, entre la llibreria de compostos del IRB Barcelona, aquells que podrien ser bons candidats a fàrmac per a modular l'activitat d'un factor de transcripció relacionat amb el càncer (SNAIL1), l'activitat del qual és gairebé impossible modular per la unió directa de fàrmacs (‘undruggable’). D'un primer conjunt de 17.000, utilitzant els models de deep machine learning, va haver-hi 131 compostos dels quals el sistema va pronosticar unes característiques (en les seves dinàmiques, interacció amb cèl·lules i proteïnes diana, etc.) que encaixaven amb l'objectiu.

S'ha confirmat experimentalment la capacitat d'aquests compostos per a degradar SNAIL1 i s'ha observat que, efectivament, en un percentatge elevat, concorda amb la que els models havien pronosticat, validant així el sistema.

Aquest treball ha estat possible gràcies al finançament rebut per la Generalitat de Catalunya, el Ministeri espanyol de Ciència i Innovació, el European Research Council, la Comissió Europea, l'Agència Estatal de Recerca i els fons FEDER.

 

 

Article relacionat:
Bioactivity descriptors for uncharacterized chemical compounds
Martino Bertoni, Miquel Duran-Frigola, Pau Badia-i-Mompel, Eduardo Pauls, Modesto Orozco-Ruiz, Oriol Guitart-Pla, Víctor Alcalde, Víctor M. Diaz, Antoni Berenguer-Llergo, Isabelle Brun-Heath, Núria Villegas, Antonio García de Herreros & Patrick Aloy
Nature Communications (2021) DOI: 10.1038/s41467-021-24150-4

 

About IRB Barcelona

Creat el 2005 per la Generalitat de Catalunya i la Universitat de Barcelona, l'IRB Barcelona és Centre d'Excel·lència Severo Ochoa des de 2011. L’objectiu de l’IRB Barcelona és fer recerca d'excel·lència en biomedicina i millorar la qualitat de vida de les persones i, en paral·lel, potenciar la formació de talent, la transferència tecnològica i la comunicació social de la ciència. Els 27 laboratoris i vuit plataformes tecnològiques treballen per respondre a preguntes bàsiques en biologia i orientades a malalties com ara el càncer, la metàstasi, l’Alzheimer, la diabetis i malalties rares. És un centre internacional que acull al voltants de 400 treballadors de més de 30 nacionalitats. Està ubicat en el Parc Científic de Barcelona. L’IRB Barcelona és un centre CERCA i és membre del Barcelona Institute of Science and Technology (BIST).