La inteligencia artificial (IA) está revolucionando la biomedicina, impactando en áreas clave como la interpretación de imágenes médicas y el análisis de grandes bases de datos de investigación. La IA está logrando avances importantes en campos como la radiología o el análisis de cortes histológicos (biopsias), imágenes de fondo de ojo o de endoscopias, transformando la forma en que los profesionales médicos diagnostican y tratan enfermedades.
Hoy en día, las herramientas impulsadas por IA no solo facilitan la captura de dictados médicos y la transcripción de entrevistas con pacientes, sino que también permiten la generación automática de notas en las historias clínicas electrónicas. Estas innovaciones en inteligencia artificial aplicada a la medicina ya no son meras proyecciones futuristas, sino realidades que benefician tanto a médicos como a pacientes en la práctica diaria.
Además, la IA está cada vez más presente en el análisis de bases de datos masivas (Big Data), que abarcan desde datos clínicos hasta resultados genómicos. Las tecnologías ómicas, como el genoma, transcriptoma, proteoma o metaboloma, generan grandes volúmenes de datos difíciles de analizar con métodos tradicionales. Aquí es donde la IA y el machine learning juegan un papel crucial, proporcionando herramientas avanzadas para el análisis de estos datos complejos.
Errores en el análisis de datos y sus consecuencias
Un ejemplo reciente muestra los riesgos asociados con los errores en el análisis de datos. En julio de 2024, el Dr. Miguel Hernández Bronchud destacó un caso de estudio en su post en LinkedIn donde la prestigiosa revista Nature tuvo que retractar un artículo debido a un error en la clasificación de secuencias genómicas. Los autores del estudio confundieron millones de secuencias de ADN humano con secuencias microbianas, lo que resultó en conclusiones incorrectas sobre las relaciones entre ADN del cáncer y microbiota.
Riesgos del ruido y sesgos en el análisis de Big Data
Este incidente subraya los peligros del «ruido» y los sesgos en el análisis de datos masivos. En muchos casos, estos problemas pueden llevar a resultados falsos o asociaciones espurias. Como ejemplo, estudios han correlacionado falsamente el consumo de chocolate con ganar un premio Nobel o el número de incendios forestales con ataques de tiburones en las playas de California. Estos dos ejemplos se explican por el sesgo de una tercera variable que explica la asociación, el nivel económico del país en el primer ejemplo y las altes temperaturas en el segundo. En otras ocasiones es simplemente el azar el que genera asociaciones casuales y no causales.
Los sistemas de IA, aunque poderosos, no están exentos de estos desafíos. La calidad de los datos es esencial para obtener resultados precisos y evitar que los errores en los análisis conduzcan a interpretaciones equivocadas.
Importancia de la validación de datos en ciencias ómicas
Las ciencias ómicas son un campo en crecimiento y aún no existen suficientes datos contrastados para estimar con precisión cuántos estudios pueden estar afectados por errores similares. Sin embargo, algunas auditorías sugieren que entre el 50% y el 89% de los resultados publicados en investigación biomédica preclínica no son reproducibles. Esto plantea una preocupación importante sobre la fiabilidad de los resultados en este tipo de estudios.
IA y precaución en el análisis de datos
A medida que la IA sigue avanzando en la medicina y otras disciplinas, es crucial mantener una actitud crítica hacia los resultados generados. La prudencia debe ser siempre una prioridad para evitar interpretaciones incorrectas que puedan surgir del uso indiscriminado de Big Data y análisis múltiples.
Los datos falsos pueden estar presentes en cualquier investigación, especialmente en campos como las ciencias sociales y la biomedicina. Por ello, es fundamental aplicar el pensamiento crítico y cuestionar las correlaciones aparentes antes de aceptarlas como verdades científicas.