Detección automática de trastornos de la voz desde una perspectiva práctica
Palabras clave:
detección automática de trastornos de la voz, calibración, modelos auto-supervisados, proper scoring rules, aplicaciones en saludResumen
Los trastornos de la voz, como la disfonía, son frecuentes y en muchos casos, no reciben tratamiento hasta que se vuelven graves. Facilitar su detección podría contribuir a un diagnóstico temprano y a un tratamiento oportuno. En este estudio, abordamos los aspectos prácticos de la detección automática de trastornos de la voz (AVDD). Los datos anotados para trastornos de la voz suelen ser escasos debido a los desafíos involucrados en la recolección y anotación de dichos datos. Sin embargo, existen algunos conjuntos de datos relativamente grandes disponibles para un número reducido de dominios. En este con- texto, proponemos el uso de una combinación de datos fuera del dominio y dentro del dominio para entrenar un sistema AVDD basado en redes neuronales profundas, y ofrecemos orientación sobre la cantidad mínima de datos dentro del dominio necesarios para lograr un rendimiento aceptable. Además, proponemos el uso de una métrica basada en cos- tos, el costo esperado normalizado (EC), para evaluar el rendimiento de los sistemas AVDD de manera que refleje de cerca las necesidades de la aplicación. Como beneficio adicional, las decisiones óptimas para el EC pueden tomarse de forma fundamentada mediante la teoría de decisión de Bayes. Finalmente, argumentamos que, para aplicaciones médicas como AVDD, las decisiones categóricas deben ir acompañadas de puntuaciones interpretables que reflejen la confianza del sistema. Aquí mostramos que añadir una etapa de calibración entrenada con una pequeña cantidad de datos dentro del dominio puede mejorar estos modelos y apoyar a los profesionales en su toma de decisiones.
Descargas
Publicado
Número
Sección
Licencia
Derechos de autor 2025 Jazmín Vidal, Dayana Ribas, Cyntia Bonomi, Eduardo LLeida, Luciana Ferrer, Alfonso Ortega

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Acorde a estos términos, el material se puede compartir (copiar y redistribuir en cualquier medio o formato) y adaptar (remezclar, transformar y crear a partir del material otra obra), siempre que a) se cite la autoría y la fuente original de su publicación (revista y URL de la obra), b) no se use para fines comerciales y c) se mantengan los mismos términos de la licencia.











