Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición

Autores/as

  • Agustín Nicolás Dramis Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina
  • María Soledad Fernández Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina
  • Adriana Alicia Pérez Universidad de Buenos Aires, Argentina
  • Pablo Guillermo Turjanski Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina

Palabras clave:

calidad de datos , Simulación , Datos antropométricos

Resumen

El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales.

Descargas

Publicado

2023-07-21

Número

Sección

CAIS - Congreso Argentino de Informática y Salud

Cómo citar

Dramis, A. N., Fernández, M. S., Pérez, A. A., & Turjanski, P. G. (2023). Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición. JAIIO, Jornadas Argentinas De Informática, 9(5), 20-27. https://revistas.unlp.edu.ar/JAIIO/article/view/18128