AlphaFold 2: revolucionando la biología molecular a través de la IA

La expansión del conocimiento humano a través del uso de la Inteligencia Artificial continúa su imparable marcha. Esta vez, la tecnología desarrollada por la empresa británica DeepMind ha conseguido descifrar un problema en el que la ciencia biológica ha trabajado durante los últimos 50 años: el plegamiento proteico. AlphaFold 2 –tal es el nombre de este sistema operado por IA- permitirá acelerar significativamente la investigación de una infinidad de campos científicos que afectan nuestro universo.

 

“Se trata de algo que simplemente no esperé que suceda tan rápido. Es asombroso”. Así es como describe el biólogo de la Universidad de Columbia, Mohammed AlQuraishi, a AlphaFold 2, la versión más reciente de un programa diseñado por DeepMind, compañía pionera en la creación de sistemas operados por Inteligencia Artificial.

Fundada hace ya una década por Shane Legg y Demis Hassabis –investigador científico y programador de videojuegos, respectivamente-, esta empresa londinense se convirtió en un fenómeno internacional cuando, en el año 2016, su programa AlphaGo venció al campeón mundial de Go, el surcoreano Lee Sedol.

No satisfechos con este logro -considerado en su momento como estar adelantado al menos 10 años en el tiempo-, el equipo de científicos y programadores de DeepMind comenzó a trabajar en el desarrollo de AlphaFold, un sistema basado en Inteligencia Artificial que se encarga de predecir estructuras proteicas plegables. Este es un desafío que fue planteado en un elaborado artículo publicado en 2012 por dos bioquímicos de la Universidad Stony Brook, Ken A. Dill y Justin L. Maccallum.

Tras arduos años de trabajo, en 2018 DeepMind presentó su innovador programa en la competición mundial Evaluación Crítica de las Técnicas para la Predicción Estructural Proteica (CASP, por sus siglas en inglés). A pesar de que el código de este programa se hallaba en sus etapas iniciales, logró alcanzar el nivel más alto de precisión entre todas las demás propuestas.

Sin embargo, fue la segunda versión presentada en el último CASP de 2020 en donde este programa alcanzó su máximo logro hasta el momento. Tras haber obtenido un puntaje mayor a 90 en su capacidad de producir modelos proteicos de laboratorio, AlphaFold 2 revolucionó por completo el estudio de la biología moderna.

Las proteínas son complejas moléculas formadas por cadenas de aminoácidos y se encargan de regular el comportamiento de toda célula viva. Debido a que esta función es determinada por la figura de cada proteína, un sistema que identifique y vaticine nuevas estructuras proteicas resulta de una enorme importancia para la ciencia biológica. AlphaFold 2 se destaca no sólo por realizar este proceso con la misma calidad de un laboratorio, sino que lo hace con una mayor velocidad.

Debido a la capacidad que posee este avanzado código operado por Inteligencia Artificial para predecir la estructura de proteínas de una manera tan rápida y precisa, los futuros avances en numerosas áreas de la ciencia serán casi ilimitados. Para entender en términos concretos el potencial de AlphaFold 2 a la hora de predecir el plegamiento proteico, es necesario repasar algunas de las aplicaciones científicas concretas que brindará este robusto programa:

  • Estudio de enfermedades diversas como la leishmaniasis –enfermedad parasitaria causada por la picadura de un mosquito-, encefalitis letárgica, malaria, etc.
  • Descubrimiento de nuevas enzimas que transformen desechos industriales como el plástico y derivados del petróleo en elementos menos nocivos para el medio ambiente.
  • Detección e identificación de nuevos patógenos, creando así la posibilidad de generar los anticuerpos necesarios para combatirlos.
  • Creación de polímeros plegables, los cuales pueden utilizarse para inhibir interacciones proteicas, generar antibióticos de amplio espectro y materiales de almacenaje ópticos, entre muchos otros.
  • Comprensión del mecanismo de acción de enfermedades causadas por fallas en los pliegues proteicos como la diabetes de Tipo II, Alzheimer, Parkinson, Huntington y la esclerosis lateral amiotrófica.
  • Investigación sobre la producción de nuevas proteínas sintéticas, con el objetivo de incrementar el volumen de las cosechas y aumentar la capacidad nutritiva de las plantas.

Los numerosos elogios pronunciados por los renombrados académicos que presenciaron este trascendental momento no dejaron dudas: AlphaFold 2 tiene la capacidad de revolucionar la ciencia moderna. Andrei Lupas, Director de biología del Max Planck Institute, consideró que el sistema es tan preciso, que hasta casi puso en dudas la ética de sus creadores: “No hay manera de que hayan podido hacer trampa con esto. No entiendo cómo lo hicieron”, afirmó incrédulo el profesional.

Antes de que comience a implementarse la Inteligencia Artificial en la predicción de modelos proteicos, este proceso se llevaba a cabo en laboratorios. Tal procedimiento se caracteriza por ser tremendamente lento y costoso, demandando cientos de miles de dólares y varios años de pruebas. En cambio, el sistema AlphaFold 2 puede predecir la silueta de una proteína en cuestión de días.

La sorpresa y entusiasmo de los líderes del CASP 2020 resulta estar sobradamente justificada. Las técnicas convencionales para predecir estructuras proteicas requieren de largos estudios de laboratorio que incluyen la crio-microscopía electrónica (crioME), la resonancia magnética nuclear y la cristalografía de rayos X. Naturalmente, estos procedimientos –si bien resultan ser muy precisos- siempre han resultado ser inefectivos debido a su alto costo y extenso tiempo de ejecución.

Es por esta razón que empresas de computación de alta gama como DeepMind comenzaron a trabajar en un sistema que acelere este proceso, sin perder por ello un alto nivel de precisión. Utilizando una arquitectura basada en el Deep Learning, esta compañía londinense logró generar un código que se sirve de varias técnicas avanzadas para definir y refinar las estructuras proteicas.

A través de diversos y avanzados procesos como el alineamiento múltiple de secuencias (MSA), la representación de pares de aminoácidos residuales y secuencias evolucionadas de genes, AlphaFold 2 logra crear precisos modelos proteicos en 3D. Este conjunto de técnicas es el mismo que han utilizado los laboratorios modernos para desarrollar una vacuna efectiva contra el Covid-19.

Para poder computar las 170 mil estructuras proteicas que se hallan en el banco de datos internacional, este sistema emplea unas 16 TPUs v3 (Unidades de Procesamiento Tensorial), las cuales son comúnmente utilizadas para acelerar procesos basados en Inteligencia Artificial. Esta capacidad de cómputo es relativamente modesta, por lo cual es de esperar que sistemas similares que funcionen con un hardware más potente produzcan resultados aún más rápidos y precisos.

Una vez más, otra área de la ciencia que implementó al Deep Learning en su procesamiento de información nos provee de una gran herramienta. Esta vez, es para una mejor comprensión acerca del funcionamiento de las moléculas que regulan la vida misma. Gracias a AlphaFold 2, una investigación que comenzó en 1972 con el postulado del bioquímico Christian B. Anfinsen ha logrado resolverse en tan sólo unos pocos años de trabajo.

En aquella oportunidad, durante la recepción de su Premio Nobel de Química, el científico norteamericano declaró que la secuencia de aminoácido de una proteína debería determinar completamente su estructura. Ahora, tras largas décadas de realizar este proceso a través del lento y costoso análisis de laboratorio, la Inteligencia Artificial le permitirá a la ciencia moderna explicar y hasta moldear el mundo que nos rodea.

 

Fuentes
Heaven, W. D. (30 de Noviembre de 2020). DeepMind’s protein-folding AI has solved a 50-year-old grand challenge of biology. Technology Review. Obtenido de https://www.technologyreview.com/
Hassabis, D. (15 de Enero de 2020). AlphaFold: Using AI for scientific discovery. DeepMind. Obtenido de https://deepmind.com/
Share on facebook
Share on twitter
Share on whatsapp
Share on email

Seguir leyendo

Leave a Reply