Investigadores del Laboratorio Europeo de Biología Molecular, en colaboración con el Centro Alemán de Investigación del Cáncer (DKFZ) de Alemania y la Universidad de Copenhague de Dinamarca, desarrollaron un modelo de IA generativa que utiliza registros médicos a gran escala para estimar cómo podría cambiar la salud humana con el tiempo.
Y es que esta IA logra pronosticar el riesgo y la cronología de más de 1.000 enfermedades, así como predecir los resultados de salud con más de una década de antelación.
La IA analizó cientos de miles de datos
Este nuevo modelo de IA generativa se diseñó a medida utilizando conceptos algorítmicos similares a los empleados en los modelos de lenguaje extenso (LLM). Se entrenó con datos anónimos de 400.000 participantes del Biobanco del Reino Unido. Los investigadores también probaron con éxito el modelo utilizando datos de 1,9 millones de pacientes del Registro Nacional de Pacientes de Dinamarca.
Este enfoque es una de las demostraciones más completas hasta la fecha de cómo la IA generativa puede modelar la progresión de enfermedades humanas a escala. “Nuestro modelo de IA es una prueba de concepto que demuestra que la IA puede aprender muchos de nuestros patrones de salud a largo plazo y utilizar esta información para generar predicciones significativas”, explicó Ewan Birney, director ejecutivo interino del Laboratorio Europeo de Biología Molecular (EMBL).
“Al modelar la evolución de las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo surgen ciertos riesgos. Así cómo planificar mejor las intervenciones tempranas. Es un gran paso hacia enfoques más personalizados y preventivos de la atención médica”, dijo.
Aprende datos de salud y modelo historiales médicos
Así como los modelos de lenguaje extensos pueden aprender la estructura de las oraciones, este modelo de IA aprende la gramática de los datos de salud para modelar los historiales médicos como secuencias de eventos que se desarrollan a lo largo del tiempo. Estos eventos incluyen diagnósticos médicos o factores de estilo de vida como el tabaquismo. El modelo aprende a predecir el riesgo de enfermedad a partir del orden en que ocurren dichos eventos y el tiempo transcurrido entre ellos.
“Los eventos médicos suelen seguir patrones predecibles”, indicó Tom Fitzgerald, científico del Instituto Europeo de Bioinformática del EMBL (EMBL-EBI). “Nuestro modelo de IA aprende esos patrones y puede predecir futuros resultados de salud. Nos permite explorar qué podría suceder con base en el historial médico de una persona y otros factores clave. Fundamentalmente, esto no es una certeza, sino una estimación de los riesgos potenciales”, explicó.
¿Qué enfermedades puede predecir la IA?
El modelo funciona especialmente bien en afecciones con patrones de progresión claros y consistentes, como ciertos tipos de cáncer, infartos y septicemia (un tipo de envenenamiento de la sangre). Sin embargo, el modelo es menos fiable en afecciones más variables, como trastornos de salud mental o complicaciones relacionadas con el embarazo que dependen de eventos vitales impredecibles.
Al igual que los pronósticos meteorológicos, este nuevo modelo de IA proporciona probabilidades, no certezas. No predice con exactitud qué le sucederá a una persona. Sin embargo, ofrece estimaciones precisas de la probabilidad de que ciertas afecciones se presenten en un período determinado.
Por ejemplo, podría predecir la probabilidad de desarrollar una enfermedad cardíaca durante el próximo año. Estos riesgos se expresan como tasas a lo largo del tiempo, similar a pronosticar un 70% de probabilidad de lluvia mañana. Generalmente, los pronósticos a corto plazo tienen mayor precisión que los de largo plazo.
Por ejemplo, el modelo predice diferentes niveles de riesgo de infarto. Considerando la cohorte del Biobanco del Reino Unido de 60 a 65 años, el riesgo de infarto varía desde una probabilidad de 4 entre 10.000 al año para algunos hombres hasta aproximadamente 1 entre 100 en otros, dependiendo de sus diagnósticos previos y estilo de vida.
Tiene limitaciones
El modelo está calibrado para generar estimaciones precisas de riesgo a nivel poblacional, pronosticando la frecuencia con la que ciertas afecciones se presentan en grupos de personas. Sin embargo, como cualquier modelo de IA, presenta limitaciones.
Dado que los datos de entrenamiento del modelo, provenientes del Biobanco del Reino Unido, provienen principalmente de personas de entre 40 y 60 años, los eventos de salud infantil y adolescente están subrepresentados.