Extracción de información de Historias Clínicas Electrónicas escritas en español para realizar inteligencia epidémica

Autores/as

  • Javier Petri Universidad de Buenos Aires, Argentina
  • Pilar Barcena Barbeira Universidad de Buenos Aires, Argentina
  • Viviana Cotik Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina

Palabras clave:

reconocimiento de entidades nombradas, BioNLP, historias clínicas electrónicas en español, detección automática de síntomas, vigilancia basada en eventos

Resumen

La detección automática de síntomas a partir de historias clínicas electrónicas es una fuente valiosa para los sistemas de vigilancia basados en eventos. En este estudio, desarrollamos herramientas para detectar automáticamente síntomas asociados a  enfermedades febriles en historias clínicas electrónicas redactadas en español. Para ello, utilizamos un corpus personalizado que incluye 6.228 reportes de salud anotados por expertos y aproximadamente 1 millón de reportes no anotados. Nuestra estrategia consistió en ajustar modelos de reconocimiento de entidades nombradas de última generación, incluyendo modelos BiLSTMCRF y modelos basados en transformers como RoBERTa. Nos enfocamos en modelos adaptados al dominio y a la tarea para mejorar el rendimiento: los primeros fueron pre-entrenados en corpus biomédicos, mientras que los segundos fueron pre-entrenados adicionalmente en nuestros reportes de salud no anotados. A pesar de las limitaciones computacionales, nuestros modelos demostraron resultados prometedores. En particular, RoBERTa-Clinico, un modelo basado en transformers adaptado a la tarea y pre-entrenado sobre nuestro corpus no anotado, obtuvo el mejor rendimiento para el micro recall (79,30) y un F1 micro de 70,83, cifras comparables a estudios similares. De este modo, contribuimos al limitado cuerpo de trabajos en BioNLP en español.

Descargas

Publicado

2025-10-15

Cómo citar

Petri, J., Barcena Barbeira, P., & Cotik, V. (2025). Extracción de información de Historias Clínicas Electrónicas escritas en español para realizar inteligencia epidémica. JAIIO, Jornadas Argentinas De Informática, 11(1), 102. https://revistas.unlp.edu.ar/JAIIO/article/view/19758