Modelo de inteligencia artificial encuentra moléculas de fármacos potenciales mil veces más rápido
La totalidad del universo conocido está repleto de un número infinito de moléculas. Pero, ¿qué fracción de estas moléculas tiene características similares a las de las drogas que pueden usarse para desarrollar tratamientos farmacológicos que salvan vidas? ¿Millones? Miles de millones? Trillones? La respuesta: novemdecillion, o 10 60 . Este número gigantesco prolonga el proceso de desarrollo de fármacos para enfermedades de rápida propagación como el covid-19 porque va mucho más allá de lo que pueden calcular los modelos de diseño de fármacos existentes. Para ponerlo en perspectiva, la Vía Láctea tiene alrededor de 100 mil millones , o 10 11 , estrellas.
En un documento que se presentará en la Conferencia internacional sobre aprendizaje automático Ubicaciones y Ver también (hmong.es), los investigadores del MIT desarrollaron un modelo geométrico de aprendizaje profundo llamado EquiBind que es 1200 veces más rápido que uno de los modelos computacionales de acoplamiento molecular más rápidos existentes, QuickVina2-W, en unir con éxito moléculas similares a fármacos a proteínas. EquiBind se basa en su predecesor, EquiDock , que se especializa en la unión de dos proteínas mediante una técnica desarrollada por el difunto Octavian-Eugen Ganea , un reciente Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT y la Clínica Abdul Latif Jameel para el Aprendizaje Automático en Salud (Clínica Jameel) postdoctorado, quien también fue coautor del documento EquiBind.
Antes de que pueda llevarse a cabo el desarrollo de fármacos, los investigadores de fármacos deben encontrar moléculas similares a fármacos prometedoras que puedan unirse o “acoplarse” adecuadamente a ciertas proteínas objetivo en un proceso conocido como descubrimiento de fármacos. Después de acoplarse con éxito a la proteína, el fármaco de unión, también conocido como ligando, puede detener el funcionamiento de una proteína. Si esto le sucede a una proteína esencial de una bacteria, puede matar a la bacteria, confiriendo protección al cuerpo humano.
Sin embargo, el proceso de descubrimiento de fármacos puede ser costoso tanto desde el punto de vista financiero como informático, con miles de millones de dólares invertidos en el proceso y más de una década de desarrollo y pruebas antes de la aprobación final de la Administración de Alimentos y Medicamentos. Además, el 90 por ciento de todos los medicamentos fallan una vez que se prueban en humanos debido a que no tienen efectos o tienen demasiados efectos secundarios. Una de las formas en que las compañías farmacéuticas recuperan los costos de estos fracasos es aumentando los precios de los medicamentos que tienen éxito.
El proceso computacional actual para encontrar moléculas candidatas a fármacos prometedoras es así:
la mayoría de los modelos computacionales de última generación se basan en un muestreo pesado de candidatos junto con métodos como puntuación, clasificación y ajuste fino para obtener el mejor “ajuste” entre los ligando y la proteína.
Hannes Stärk, autor principal del artículo y estudiante de posgrado de primer año asesorado por Regina Barzilay y Tommi Jaakkola en el Departamento de Ingeniería Eléctrica e Informática del MIT, compara las metodologías típicas de unión de ligando a proteína con “tratar de encajar una clave en una cerradura con muchos agujeros para cerraduras. Los modelos típicos califican cada “ajuste” antes de elegir el mejor. Por el contrario, EquiBind predice directamente la ubicación clave precisa en un solo paso sin conocimiento previo del bolsillo objetivo de la proteína, lo que se conoce como ” acoplamiento ciego “.
A diferencia de la mayoría de los modelos que requieren varios intentos para encontrar una posición favorable para el ligando en la proteína, EquiBind ya tiene un razonamiento geométrico incorporado que ayuda al modelo a aprender la física subyacente de las moléculas y a generalizar con éxito para hacer mejores predicciones al encontrar nuevos datos no vistos. .
La publicación de estos hallazgos atrajo rápidamente la atención de los profesionales de la industria, incluido Pat Walters, director de datos de Relay Therapeutics. Walters sugirió que el equipo pruebe su modelo en un fármaco y una proteína ya existentes que se usan para el cáncer de pulmón, la leucemia y los tumores gastrointestinales. Mientras que la mayoría de los métodos de acoplamiento tradicionales no pudieron unir con éxito los ligandos que funcionaron en esas proteínas, EquiBind tuvo éxito.
“EquiBind brinda una solución única al problema de acoplamiento que incorpora tanto la predicción de la posición como la identificación del sitio de unión”, dice Walters.
“Este enfoque, que aprovecha la información de miles de estructuras cristalinas disponibles públicamente, tiene el potencial de impactar el campo de nuevas maneras”.
“Nos sorprendió que, mientras que todos los demás métodos se equivocaron por completo o solo acertaron uno, EquiBind pudo ponerlo en el bolsillo correcto, por lo que nos alegró mucho ver los resultados”, dice Stärk.
Si bien EquiBind recibió una gran cantidad de comentarios de profesionales de la industria que ayudaron al equipo a considerar usos prácticos para el modelo computacional, Stärk espera encontrar diferentes perspectivas en el próximo ICML en julio.
“Los comentarios que más espero son sugerencias sobre cómo mejorar aún más el modelo”, dice. “Quiero conversar con esos investigadores… para decirles cuáles creo que pueden ser los siguientes pasos y alentarlos a que sigan adelante y usen el modelo para sus propios artículos y para sus propios métodos… ya hemos tenido muchos investigadores que se acercan y preguntando si creemos que el modelo podría ser útil para su problema”.
Este trabajo fue financiado, en parte, por el consorcio Pharmaceutical Discovery and Synthesis; la Clínica Jameel; el programa de descubrimiento de contramedidas médicas contra amenazas nuevas y emergentes de la DTRA; el programa de Descubrimiento Molecular Acelerado de DARPA; la beca MIT-Takeda; y la subvención de NSF Expeditions Investigación colaborativa: comprensión del mundo a través del código.
Este trabajo está dedicado a la memoria de Octavian-Eugen Ganea, quien hizo contribuciones cruciales a la investigación del aprendizaje automático geométrico y fue mentor generoso de muchos estudiantes: un erudito brillante con un alma humilde.
Relacionado Nuve :
Controlar las moléculas diana del 60% de los fármacos mediante luz Revista NUVE