Inferencia causal en series de tiempo de Twitter y encuestas políticas

Authors

  • Federico Albanese Universidad de Buenos Aires, Argentina
  • Juan Manuel Baldonado Universidad de Buenos Aires, Argentina
  • Esteban Feuerstein Universidad de Buenos Aires, Argentina

Keywords:

Inferencia causal, series de tiempo, Twitter, redes sociales, técnicas de procesamiento del lenguaje natural

Abstract

Las redes sociales han sido utilizadas como medios para la discusión política de los ciudadanos [1]. En este trabajo nos propusimos analizar la influencia que ejerce el discurso en las redes sociales sobre la opinión pública de los candidatos políticos en contextos electorales. Para ello conformamos un dataset con 4.4 millones de tweets políticos durante las elecciones presidenciales estadounidenses entre Trump y Biden del 2020 y analizamos 229 encuestas presidenciales realizadas por 29 encuestadores. Luego, armamos series temporales con los resultados de las encuestas y con la cantidad, tópico del que hablan y sentimiento (positividad / negatividad) de los tweets que mencionan a cada candidato, usando técnicas de procesamiento del lenguaje natural de forma similar a trabajos previos [2]. Aplicando herramientas de inferencia causal en series de tiempo [3] [4] como la causalidad de Granger [5], Información Mutua Condicional [6] y Base de Funciones Radiales [7], encontramos resultados estadísticamente significativos de una relación causal. En particular, el sentimiento con el que se habla de los candidato y ciertos tópicos particulares que se debaten en Twitter impactan sobre la intención de voto que finalmente recibe cada candidato presidencial.

Downloads

Published

2022-12-14

Issue

Section

AGRANDA - Simposio Argentino de Ciencia de Datos y GRANdes DAtos

How to Cite

Albanese, F., Baldonado, J. M., & Feuerstein, E. (2022). Inferencia causal en series de tiempo de Twitter y encuestas políticas. JAIIO, Jornadas Argentinas De Informática, 8(1), 25-27. https://revistas.unlp.edu.ar/JAIIO/article/view/18388