Análisis de calidad de los datos en las estadísticas públicas y privadas, ante la implementación del Big Data

Autores/as

DOI:

https://doi.org/10.24215/23143738e119

Palabras clave:

Big Data, calidad de los datos, estadísticas oficiales, estadísticas privadas, privacidad, privacidad de los datos

Resumen

El incremento del almacenaje y explotación de los datos a partir del avance de las tecnologías de mediación digital generó cambios en la gestión de los datos, así como también presentó nuevos retos en relación a su calidad. A partir de una amplia búsqueda de información especializada, el presente estudio, de carácter exploratorio, tiene como objetivo describir las diferentes valoraciones respecto a la calidad de los datos en el entorno de la producción de las estadísticas públicas y en el sector empresarial privado, examinando en particular los cambios producidos en el marco de la calidad estadística en ambos contextos, a partir de las potencialidades de la gestión del uso del Big Data.

Descargas

Los datos de descargas todavía no están disponibles.

Métricas

Cargando métricas ...

Biografía del autor/a

Fernando Ariel Manzano, Instituto de Geografía, Historia y Ciencias Sociales (IGEHCS)

Doctor en Demografía (UNC), a nivel universitario se graduó como Licenciado en Economía (UBA) y Licenciado en Sociología (UBA). Investigador Adjunto en CONICET. Realiza investigación aplicada en ciencias sociales, con un enfoque interdisciplinario. Siendo sus principales líneas de investigación actuales son: Análisis interdisciplinario del mercado laboral; Análisis crítico y contribuciones de la demografía a las ciencias sociales; Geografía y calidad de vida; y Cambios socio-demo-económicos en la planificación del desarrollo. Su producción científica consta de más 45 artículos científicos en revistas indizadas, 3 libros y más de 10 capítulos en libros.

Daniela Avalos, Facultad de Ciencias Sociales, Universidad de Buenos Aires, Argentina.

Licenciada en Sociología por la Universidad de Buenos Aires, graduada en el año 2021, con promedio 8,04 (Ocho, cero cuatro). Actualmente cursa el Profesorado de Enseñanza Normal y Superior en Sociología, con promedio 10 (diez), en la Universidad de Buenos Aires. También es alumna de la Maestría en Generación y Análisis de información estadística de la Universidad de Tres de febrero. Por último, es postulante para una Beca de posgrado en Demografía. Las líneas de investigación en que trabaja son: Migraciones y desigualdad de género en el mercado laboral intrarregional (América Latina), Estadística y nuevas fuentes de información, calidad de los datos estadísticos en estadísticas públicas y privadas.

Citas

Aldana, H. S. M., Rivas, J. D. C. e Hidalgo, J. M. V. (2018). Big Data, el futuro de las predicciones certeras. Revista Avenir, 2(2), 10-16.

Alonso-Arévalo, J. y Vázquez Vázquez, M. (2016). Big Data: La próxima “gran cosa” en la gestión de la información. BID: textos universitaris de biblioteconomia i documentació, 36, 1-3.

Arribas, C., Casado, J. y Martínez, A. (2003). Gestión orientada a asegurar la calidad de los datos en los Institutos Nacionales de Estadística. Repositorio digital de la Comisión Económica para América Latina y el Caribe. https://repositorio.cepal.org/handle/11362/16455/

Brackstone, G. (2003). Gestión de la calidad de los datos en un organismo estadístico. Repositorio digital de la Comisión Económica para América Latina y el Caribe. http://hdl.handle.net/11362/16464

Burgess, J. y Bruns, A. (2012). Twitter Archives and the Challenges of “Big So-cial Data” for Media and Communication Research. M/C Journal, 15(5). https://doi.org/10.5204/mcj.561

Bussi, J., Marí, G. P. y Méndez, F. (2017). El desafío del big data en estadísticas oficiales en Argentina. Facultad de Ciencias Económicas y Estadística de la Universidad de Rosario.

Cárdenas, G. C. (2009). Las herramientas de software para el análisis cuantitativo de información: Estudio preliminar de aplicaciones desarrolladas en Cuba. Bibliotecas. Anales de investigación, (5), 53-62.

Carretero, A. I. G. y Velthuis, M. P. (2018). Importancia de la calidad de los datos en la transformación digital. RUIDERAe: Revista de Unidades de Información, 13.

CEPAL (2011). Guía para asegurar la calidad de los datos censales (Serie N°74). Repositorio digital de la Comisión Económica para América Latina y el Caribe. http://hdl.handle.net/11362/5515

CEPAL (2020). Ley Genérica sobre Estadísticas Oficiales para América Latina (LC/CEA.10/8). Repositorio digital de la Comisión Económica para América Latina y el Caribe. http://hdl.handle.net/11362/45253

Christodoulou, P., Decker, S., Douka, A. V., Komopoulou, C., Peristeras, V., Sgagia, S., Tsarapatsanis, V. y Vardouniotis, D. (2018). Data Makes the Public Sector Go Round. En P. Parycek, O. Glassey, M. Janssen, H. J. Scholl, E. Tambouris, E. Kalampokis, S. Virkar (eds.), Electronic Government. EGOV 2018. Lecture Notes in Computer Science (vol. 11.020). Springer. https://doi.org/10.1007/978-3-319-98690-6_19

Cortés, C. B. Y., Landeta, J. M. I. y Chacón, J. G. B. (2017). El entorno de la industria 4.0: implicaciones y perspectivas futuras. Conciencia tecnológica, (54), 33-45.

Cortés Rodríguez, K. I. (2020). Calidad de datos contextual en Big Data: calidad de datos de Twitter. Escuela de Ingeniería y Gestión [Tesis de grado, Instituto Tecnológico de Buenos Aires (ITBA)]. http://ri.itba.edu.ar/handle/123456789/3184

Del-Fresno-García, M. (2014). Haciendo visible lo invisible: Visualización de la estructura de las relaciones en red en Twitter por medio del análisis de redes sociales. El Profesional de la Información, 23(3), 246–252. https://doi.org/10.3145/epi.2014.may.04

Elvers, E. (Agosto de 2002). Comparison of Survey and Register Statistics. The International Conference on Improving Surveys, Denmark, University of Copenhagen.

Fernández, A. (2020). El papel del Big Data en el reporting y la toma de decisiones. Revista de Contabilidad y Dirección, 31, 21-36.

Fernández, Y. A. y Ferrer, D. C. (2016). Big Data: una herramienta para la administración pública. Ciencias de la Información, 47(3), 3-8.

Galimany Suriol, A. (2015). La creación de valor en las empresas a través del Big Data [Tesis de Grado, Universidad de Barcelona]. Dipòsit Digital de la Universitat de Barcelona. http://hdl.handle.net/2445/67546

García, S., Ramírez-Gallego, S., Luengo, J. y Herrera, F. (2016). Big Data: Preprocesamiento y calidad de datos. Novática, 237,17, 17-23.

García Del Río, A. y López Contreras, I. R. (2018). Implementación de herramientas de extracción, transformación y carga de datos estructurados en Big Data [Tesis de Grado, Universidad Autónoma de ciudad Juárez]. http://hdl.handle.net/20.500.11961/4665

Garzón Arredondo, A. (2015). Evolución e impacto de Big Data en empresas grandes de diferentes industrias del sector corporativo en Antioquia [Tesis de Doctorado, Universidad EAFIT]. Repositorio Institucional Universidad EAFIT

Gauna, N., Roggi, C. y Zuloaga, N. (2020). Los registros administrativos en la construcción y consolidación del Sistema Estadístico de la Ciudad. Población de Buenos Aires, 17(29), 43-49.

Giusti, A. y Massé, G. (1997). Aspectos conceptuales relativos a la evaluación de calidad. En INDEC, Evaluación de la calidad de datos y avances metodológicos (Serie J n° 2). Secretaría de Programación Económica, Ministerio de Economía y Obras y Servicios Públicos.

Gualda, E. (2022). Social big data, sociología y ciencias sociales computacionales. Empiria: Revista de metodología de ciencias sociales, (53), 147-177.

Hernández, C. y Rodríguez, J. E. R. (2008). Preprocesamiento de datos estructurados. Revista vínculos, 4(2), 27-48.

Instituto Nacional de Estadística de España (INE) (2015). Política de revisión del Instituto Nacional de Estadística. https://www.ine.es/ine/codigobp/politica_revision.pdf

Jauregi-Maza, L. (2021). Big Data: la revolución de los datos masivos en la Administración Pública. Inguruak. Revista Vasca de Sociología y Ciencia Política, (71), 79-100. http://dx.doi.org/10.18543/inguruak-71-2021-art05

Joyanes Aguilar, L. (2013). Big Data: Análisis de grandes volúmenes de datos en organizaciones. Alfaomega.

Koudas, N., Sarawagi, S. y Srivastava, D. (2006). Record linkage: similarity measures and algorithms. Proceedings of the 2006 ACM SIGMOD international conference on Management of data. ACM, 802-803.

Labbé Figueroa, M. F. (2020). Big Data: Nuevos desafíos en materia de libre competencia. Revista chilena de derecho y tecnología, 9(1), 33-62.

Laney, D. (2001). 3D Data management: controlling data volume, velocity y variety. META Group. https://studylib.net/doc/8647594/3d-data-management--controlling-data-volume--velocity--an...#

Lecuona, I. D. (2019). Evaluación de los aspectos metodológicos, éticos, legales y sociales de proyectos de investigación en salud con datos masivos (big data). Gaceta Sanitaria, 32, 576-578.

Lindenboim, J. (2011). Las estadísticas oficiales en Argentina ¿Herramientas u obstáculos para las ciencias sociales? Trabajo y Sociedad, 15(16), 19-38.

Lineros, E. M. (2017). El trinomio dato-información-conocimiento. En P. Díaz (Ed.) Manual sobre utilidades del big data para bienes públicos (pp. 35-48). Edimema.

López, B. (2011). Limpieza de Datos: Reemplazo de valores ausentes y Estandarización [Tesis de Doctorado, Universidad Central “Marta Abreu” de Las Villas)]. http://dspace.uclv.edu.cu:8089/handle/123456789/7213

López Porrero, B., Pérez Vázquez, R. y Batule Domínguez, M. (2010). Las reglas de asociación ordinales en la detección de errores en los datos. Revista Cubana de Ciencias Informáticas, 4(1-2), 47-52.

Luo, J.-D., Liu, J., Yang, K. y Fu, X. (2019). Big data research guided by sociological theory: A triadicdialogue among big data analysis, theory, and predictive models. The Journal of Chinese Sociology, 6(11). https://doi.org/10.1186/s40711-019-0102-4

Manovich, L. (2012). Trending: ThePromises and theChallenges of Big Social

Data. En M. Gold (Ed.), Debates in the Digital Humanities. University of Minnesota Press.

Martínez, G. (2001). Minería de datos: Cómo hallar una aguja en un pajar. Ingenierías, 14(53), 53-66.

Matteucci, M. A. (2020). ¿Es posible el uso de Big data en materia tributaria? Instituto de Extrapolítica Y Transhumanismo (IET) de Lima, Perú.

Mayer-Schönberger, V. y Cukier, K. (2013). Big data: la revolución de los datos masivos. Turner.

Mejías Alonso, E. y Soler Jiménez, J. (2017). La vigilancia y el control de la población a través de la gestión, la conservación y la explotación de datos masivos. Universidad Autónoma de Barcelona.

Moine, J. M., Haedo, A. S. y Gordillo, S. E. (2011). Estudio comparativo de metodologías para minería de datos. En XIII Workshop de Investigadores en Ciencias de la Computación. Universidad Tecnológica Nacional, Rosario.

Molina, V. H. Á. y Mérida, A. F. (2021). Datificación crítica: práctica y producción de conocimiento a contracorriente de la gubernamentalidad algorítmica. Dos ejemplos en el caso mexicano. Administración Pública y Sociedad (APyS), (11), 211-231.

Monleon-Getino, A. (2015). El impacto del big data en la sociedad de la información. Significado y utilidad. Historia y Comunicación Social, 20(2), 427-445. https://doi.org/10.5209/rev_HICS.2015.v20.n2.51392

Mons, B. (2020). Invest 5% of research funds in ensuring data are reusable. Nature, 578, 491. https://doi.org/10.1038/d41586-020-00505-7

Morello, F. (25 de enero de 2018). Analítica avanzada para la transformación digital. https://www.df.cl/opinion/columnistas/analitica-avanzada-para-la-transformacion-digital

Moreno, L. P. y Calderón, C. C. A. (2016). Empleo de Big Data en la gestión de las Telecomunicaciones. Tono, Revista Técnica de la Empresa de Telecomunicaciones de Cuba SA, 13(2), 48-57.

Naciones Unidas. (2004). Manual de Organización Estadística. https://www.cepal.org/es/publicaciones/3976-manual-organizacion-estadistica-funcionamiento-organizacion-oficina-estadistica

Naciones Unidas. (2010). Principios y recomendaciones para los censos de población y habitación. Revisión 2 (Informes Estadísticos Serie M No. 67/Rev.2). Departamento de Asuntos Económicos y Sociales. División de Estadística. https://unstats.un.org/unsd/publication/seriesm/seriesm_67rev2s.pdf

Naciones Unidas. (2011). Manual de revisión de datos de los censos de población y vivienda. Revisión 1. Departamento de Asuntos Económicos y Sociales. División de Estadística.

Naciones Unidas. (2015). Informe del Grupo de Trabajo Mundial sobre los Macrodatos en las Estadísticas Oficiales (E/CN.3/2016/1). https://www.cepal.org/es/publicaciones/3976-manual-organizacion-estadistica-funcionamiento-organizacion-oficina-estadistica

Nuñez-Arcia, Y., Díaz-de-la-Paz, L. y García-Mendoza, J. L. (2016). Algoritmo para corregir anomalías a nivel de instancia en grandes volúmenes de datos utilizando MapReduce. Revista Cubana de Ciencias Informáticas, 10(3), 105-118.

Ontiveros, E. y López Sabater, V. (2017). Economía de los Datos. Riqueza 4.0. Ariel y Fundación Telefónica. Barcelona

Paliotta, A. P. (2018). Nuevas profesiones y técnicas de web data mining en Argentina: el caso del Data Scientist. Revista del Centro de Estudios de Sociología del Trabajo (CESOT), (10), 63-94.

Pereira Villazón, T., Portilla Manjón, I. y Rodríguez Salcedo, N. (2019). Big data y Relaciones Públicas: Una revisión bibliográfica del estado de la cuestión. Revista de comunicación, 18(1), 151-165.

Pérez-Rave, J., Correa Morales, J. C., y González Echavarría, F. (2019). Metodología para explorar datos abiertos de accidentalidad vial usando Ciencia de Datos: Caso Medellín. Ingeniare. Revista chilena de ingeniería, 27(3), 495-509.

Rodríguez, P., Palomino, N. y Mondaca, J. (2017). El uso de datos masivos y sus técnicas analíticas para el diseño e implementación de políticas públicas en Latinoamérica y el Caribe. Banco Interamericano de Desarrollo.

Rojo, I. D. J. P. y Sánchez, A. A. C. (2019). Reinsurgencia de la etnografía en la era del Big Data: apuntes desde el sur global. Virtualis, 10(19), 42-56.

Rouhiainen, L. (2018). Inteligencia artificial. Alienta Editorial.

Rubinfeld, D., Gal, M. (2017). Access barriers to big data. Arizona Law Review. 59(2), 339-382. http://doi.org/10.2139/ssrn.2830586

Salgado, D. (2017). Big Data en la Estadística Pública: retos ante los primeros pasos. Economía industrial, (405), 121-129.

Salvador, M. y Ramió, C. (2020). Capacidades analíticas y gobernanza de datos en la Administración pública como paso previo a la introducción de la Inteligencia Artificial. Reforma Democr. Rev. CLAD, 77, 5-36.

Sancho, J. V., Ochoa, B. M., y Domínguez, J. C. (2014). Aproximación a una taxonomía de la visualización de datos. Revista Latina de Comunicación Social, (69), 486-507.

Serna, M. S. (2021). Inteligencia artificial y gobernanza de datos en las administraciones públicas: reflexiones y evidencias para su desarrollo. Gestión y Análisis de Políticas Públicas, (26), 20-32.

Sosa Escudero, W. (2021). Big data y ciencia de datos: conceptos, oportunidades y desafíos [Nota informativa]. Organización Internacional del Trabajo.

Stroe, M. J. (2020). Internet de las Cosas: propiedad de los datos y su tratamiento como secretos empresariales. Universidad de Zaragoza, Departamento de Derecho de la Empresa, España.

Stucke, M. y Grunes, A. (2016). Big data and competition policy. Oxford: Oxford University Press.

Teerlink, M., Sigmon, P. W., Gow, B. y Banerjee, K. (2014). El nuevo héroe del Big Data y la analítica de datos. El director de datos [Informe ejecutivo]. IBM Institute for Business Value. IBM Corporation, Estados Unidos de América.

Timarán-Pereira, S. R., Hernández-Arteaga, I., Caicedo-Zambrano, S. J., Hidalgo-Troya, A. y Alvarado Pérez, J. C. (2016). Descubrimiento de patrones de desempeño académico con árboles de decisión en las competencias genéricas de la formación profesional. Ediciones Universidad Cooperativa de Colombia

Tourís López, R. M. (2019). Secreto estadístico y protección de datos de carácter personal como límites al acceso a la información pública. La estadística de criminalidad. Derecom, (26), 75-97.

United Nations Global Working Group on Big Data (2016). Recommendations for access to data from private organizations for Official Statistics. United Nations.

Vásquez Valdivia, A. (2021). Apertura y uso de datos para hacer frente al Covid-19 en América Latina. Gestión Pública, n. 88. Santiago, Comisión Económica para América Latina y el Caribe.

Villao Balón, A. J. (2021). Aplicación de técnicas de minería de datos para predecir el desempeño académico de los estudiantes de la escuela Lic. Angélica Villón. Universidad Estatal Península de Santa Elena.

Wiseman, J. M. (2018). Data-Driven Government: The Role of Chief Data Officers. IBM Center for the Business of Government, Washington, D.C.

Zarzky T. (2016). The trouble with algorithmic decisions: An analytic road map to examine efficiency and fairness in automated and opaque decision making. Science, Technology & Human Values, 41(1), 118-132.

Zamorano Ruiz, J. (2018). Comparativa y análisis de algoritmos de aprendizaje automático para la predicción del tipo predominante de cubierta arbórea. Universidad Complutense de Madrid.

Zúñiga, G. (2019). Big data y los desafíos que plantea al abuso de posición de dominio. Revista de Actualidad Mercantil, (6), 208-226.

Publicado

2023-03-14

Cómo citar

Manzano, F. A., & Avalos, D. (2023). Análisis de calidad de los datos en las estadísticas públicas y privadas, ante la implementación del Big Data. Ciencias Administrativas, (22), 119. https://doi.org/10.24215/23143738e119

Número

Sección

Artículos Científicos