VisDecode: extracción de decisiones de diseño en visualizaciones con modelos pixel-to-text

Autores/as

  • Martín A. Sinnona Universidad Torcuato Di Tella, Argentina
  • Viviana Siless Universidad Torcuato Di Tella, Argentina
  • Emmanuel Iarussi Universidad Torcuato Di Tella, Consejo Nacional de Investigaciones Científicas y Tecnológicas (CONICET), Argentina

Palabras clave:

Visualización de datos, Extracción de atributos, Lenguaje visual

Resumen

En este trabajo introducimos VisDecode, un framework para extraer decisiones de diseño a partir de visualizaciones. Haciendo uso de imágenes rasterizadas de visualizaciones genéricas (gráficos de barra, lineas, dispersión), nuestro algoritmo identifica atributos perceptuales y los relaciona con los datos. Entrenamos una red neuronal profunda con un dataset sintético que consiste en pares de visualizaciones-decisiones de diseño. Estas visualizaciones fueron rasterizadas a partir de tablas de datos , generadas aleatoriamente por modelos de lenguaje , que incluyen variables cuantitativas y categóricas que se asemejan a datos del mundo real. Luego del entrenamiento, VisDecode es capaz de extraer decisiones de diseño de gráficos provenientes de internet. Nuestro objetivo a mediano plazo es poder mejorar las interfaces de visualización para lograr mejores prácticas de diseño.

Descargas

Publicado

2024-10-12

Número

Sección

SAIV - Simposio Argentino de Imágenes y Visión

Cómo citar

Sinnona, M. A., Siless, V., & Iarussi, E. (2024). VisDecode: extracción de decisiones de diseño en visualizaciones con modelos pixel-to-text. JAIIO, Jornadas Argentinas De Informática, 10(11), 109-112. https://revistas.unlp.edu.ar/JAIIO/article/view/17879