Investigadores del LIAA-ICC en colaboración con Fleni están explorando cómo la inteligencia artificial puede contribuir a la identificación temprana del Alzheimer y otras demencias. El grupo analiza en qué contextos los agentes conversacionales funcionan con mayor eficacia frente a los pacientes y ayudan a los médicos a detectar patologías, gracias a su capacidad para procesar y analizar grandes volúmenes de datos complejos.
Los agentes conversacionales son programas de inteligencia artificial (IA) diseñados para simular conversaciones humanas mediante texto o voz, capaces de comprender el lenguaje natural para responder preguntas, automatizar tareas y ofrecer soporte en plataformas como chats y aplicaciones móviles.
Hoy estos agentes están al alcance de la mano de cualquier persona, y uno de sus usos más extendidos —desde hace casi cinco años— es el acompañamiento y la asistencia terapéutica: desde la autoayuda guiada hasta la contención 24/7 y el complemento de la terapia humana.
Si bien herramientas como ChatGPT no reemplazan a profesionales de la salud, los usuarios pueden mantener conversaciones fluidas y hasta empáticas con estos grandes modelos de lenguaje (LLM).
El hecho de que estos agentes se comporten como psicólogos de adolescentes o como acompañantes terapéuticos de adultos mayores, escuchando y dialogando con ellos las 24 horas del día, los 365 días del año, constituye un uso cada vez más masivo y difícil de ignorar.
En este escenario, investigadores del Laboratorio de Inteligencia Artificial Aplicada (LIAA-ICC) están indagando sobre el uso de estos agentes o LLM en el contexto de la salud mental, considerando que su utilización como “terapeutas artificiales” conlleva diversos riesgos asociados.
“Aunque un agente conversacional no es un terapeuta, está cumpliendo ese rol porque la gente lo usa masivamente de esa manera. Entonces, no hay modo de evitarlo”, destaca Diego Fernández Slezak, investigador de CONICET y director del LIAA.
“El problema reside en definir si deseamos usar agentes de IA como soporte al diagnóstico o como ayuda para un terapeuta en la detección y tratamiento de enfermedades específicas, en entornos más controlados, regulados y supervisados. Queremos entender cuál es el poder, cuál es la posibilidad y cuáles son los problemas que abren cada uno de estos usos”, puntualiza Fernández Slezak.
Psiquiatría computacional para complementar la atención humana
Una primera línea de investigación del Laboratorio es la aplicación de la IA en Alzheimer y otras demencias. El propósito es explorar en qué nichos estos agentes funcionan de manera más robusta ante los pacientes, ya sea porque aceleran el proceso, mejoran la calidad de la atención o resuelven problemas que el ser humano no puede detectar, por limitaciones de precisión o por la complejidad de los datos involucrados.
“Este es un tema de investigación más nuevo para nuestro grupo, relacionado con el acceso masivo a neurólogos y neuropsicólogos en el tratamiento de la demencia. Sin dudas, la comunidad internacional en salud viene discutiendo intensamente el claro envejecimiento de la población. Pero este aumento de adultos mayores viene con un problema asociado: el decaimiento cognitivo. Es decir, la mayoría de nosotros, como pacientes, de algún modo vamos a tener un deterioro cognitivo a medida que avance nuestra edad y vamos a necesitar apoyo temprano”, explica el investigador especializado en IA aplicada.
Fundamentalmente en algunos pacientes ese deterioro será más rápido de lo normal y se manifestará como una demencia acelerada o un Alzheimer. En síntesis, la detección temprana de la demencia resulta un tópico fundamental en la investigación en salud pública, y el sistema de salud no puede ni debe ignorarlo.
Tal es así que los investigadores del LIAA están indagando cómo usar eficazmente estos agentes conversacionales en el contexto de la investigación en demencia.
“Teniendo en cuenta que uno de los principales elementos que se asocian a la demencia es la pérdida de memoria, una pregunta bien específica para empezar a trabajar este problema es: ¿cómo puedo usar agentes conversacionales para evaluar la memoria y ayudar a los profesionales médicos en esta tarea? O incluso, mejor aún, ya no solo para evaluar la memoria, sino para evaluar la progresión del deterioro de la memoria que sabemos que inexorablemente nos acompañará con el paso del tiempo”, argumenta Fernández Slezak.
Y aclara: “Nuestras investigaciones consisten en comprender cómo usar modelos de lenguaje —sean ChatGPT, Llama o Claude— para generar conversaciones con personas que permitan evaluar su calidad cognitiva y su deterioro cognitivo a lo largo del tiempo, incluso mediante estudios longitudinales”.
Para ello, los investigadores desarrollaron un proyecto piloto que consistió en el diseño de instrumentos neuropsicológicos basados en IA para diferenciar a individuos sanos de sujetos con deterioro cognitivo leve (DCL). El estudio (ver paper) incluyó a 42 participantes de entre 60 y 89 años en el Instituto Neurológico Fleni, quienes realizaron pruebas neuropsicológicas durante las cuales se grabó a los participantes en video y audio mientras realizaban una tarea de lenguaje en una plataforma web.
El propósito fue extraer marcadores de cinco modalidades: habla (transcripción automática de voz), acústica (audio), malla facial (video), combinación de formas (video) y reconocimiento de emociones (video y audio).
Cabe destacar que los marcadores de habla se correlacionaron con el lenguaje y la memoria, y en total se obtuvieron 204 marcadores de IA significativamente correlacionados con las pruebas tradicionales, de un total de 432 (47 %).
Los resultados de este estudio preliminar demostraron la validez de los algoritmos de IA aplicados a la población local, y el siguiente paso de la investigación es incluir a más pacientes con DCL para comprender mejor los patrones comunicativos diferenciales.
Esta investigación se realiza en colaboración con el equipo de Fleni, bajo la dirección de la doctora Lucía Crivelli.
“Considerando que ya tenemos un proyecto piloto replicable a una población más grande, recientemente presentamos estos resultados en un importante journal de Alzheimer y Demencia, junto con una propuesta de proyecto de investigación a una organización internacional de Alzheimer para detectar deterioro cognitivo a nivel longitudinal”, precisa Fernández Slezak.
Otro de los trabajos publicados propuso utilizar IA para ayudar a identificar y comprender las ataxias crónicas, trastornos neurológicos degenerativos que provocan la pérdida de la coordinación muscular y el control del movimiento debido a daños en el cerebelo o en otras partes del sistema nervioso central.
El estudio recurrió al uso de un asistente virtual inteligente para el diagnóstico de estos trastornos. Durante el proceso de validación se seleccionaron 453 casos clínicos de la literatura sobre 151 causas de ataxia crónica. La precisión diagnóstica se comparó con la de 21 neurólogos especializados en trastornos del movimiento y con GPT-4. También se evaluó la usabilidad en cuanto al tiempo y número de preguntas necesarias.
Los resultados preliminares revelaron que la precisión del asistente virtual fue del 90,9 %, superior a la de los neurólogos (18,3 %) y GPT-4 (19,4 %). Además, obtuvo un rendimiento significativamente superior en las causas de ataxia distribuidas por edad, herencia, frecuencia, manifestaciones clínicas asociadas y disponibilidad de tratamiento.
Una evidencia clara identificada en el estudio fue que los neurólogos y el GPT-4 mencionaron 110 diagnósticos incorrectos, el 83,6 % de los cuales fueron realizados por el GPT-4, que también generó siete alucinaciones de datos. Mientras tanto, el asistente virtual requirió un promedio de 14 preguntas y 1,5 minutos para generar una lista de diagnósticos diferenciales, lo que resultó significativamente más rápido que los neurólogos (media de 19,4 minutos).
En conclusión, el asistente virtual desarrollado por el LIAA demostró ser preciso, fácil de usar y rápido para el diagnóstico de ataxias crónicas, pudiendo contribuir como herramienta de apoyo en la consulta neurológica y extenderse a otras enfermedades, tanto neurológicas como no neurológicas.
A su vez, una segunda línea de trabajo, adicional a estos proyectos, busca aprovechar los resultados obtenidos históricamente por el LIAA para aplicar el procesamiento del lenguaje natural a patologías como la esquizofrenia —estudios previos que analizaron la coherencia del discurso, los determinantes del habla y su caracterización frente a pacientes sin la patología—replicándolos ahora en grandes modelos de lenguaje con los avances acumulados durante los últimos cinco años.
“En definitiva, la pregunta que buscamos responder es si estos modelos de lenguaje que tienen alucinaciones —ya que al usarlos de forma no técnica, hablándoles en español y prompteándolos en vez de programarlos con técnicas matemáticas formales— son capaces de caracterizar el lenguaje y eventualmente caracterizar a los pacientes de la misma manera que lo hacíamos antes”, afirma el director del LIAA.
Y menciona además que tomaron dos papers principales sobre predicción de psicosis, uno de 2015 y otro de 2018, con el fin de replicar los mismos estudios de hace quince años mediante las tecnologías actuales.
Combatiendo las alucinaciones de los modelos de IA
Por último, Fernández Slezak comenta que, hasta ahora, las técnicas de IA que estuvieron aplicando eran de análisis de texto, audio, imagen o video, donde no había alucinaciones (respuestas, datos o patrones generados por IA que son falsos o no se corresponden con la realidad), porque aún no aplicaban el uso de LLM.
“En este nuevo proyecto con agentes conversacionales aparece el gran problema de las alucinaciones y la generación de contenido falso que tienen estos modelos, y es un riesgo a explorar”, sostiene el investigador y doctor en ciencias de la computación.
Y concluye que, si bien aún no tienen una solución robusta para las alucinaciones y los sesgos de los modelos de IA, “podemos afirmar que usando técnicas de prompting (ingreso de texto a estos modelos) sumado a lo que se conoce como RAGs —bases de datos asociadas a los modelos de lenguaje—, las alucinaciones y los errores se reducen muchísimo y llegan a límites tan bajos como los de los médicos o incluso inferiores”.
De ese modo, seguramente se puede —y se podrá— pensar en usos terapéuticos o clínicos con un abordaje más científico y riguroso de estas herramientas en auge de la IA.

