Manipulación de Expresiones Faciales vía Espacio Latente de Red Generativa Antagónica (GAN)

Autores/as

  • Daiana Aranda Universidad de Buenos Aires, Argentina
  • Julieta Goria Universidad de Buenos Aires, Argentina
  • Francisco Sandalinas Universidad de Buenos Aires, Argentina
  • Mateo Suffern Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina
  • Pablo Negri Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), Argentina

Palabras clave:

StyleGANv2, Espacio Latente, Expresiones Faciales

Resumen

StyleGAN [1] destaca como la arquitectura de vanguardia en generación de rostros sintéticos altamente realistas. Su implementación proyecta una imagen en su espacio latente, el cual es posible de manipular por medio de curvas direccionales modificando rasgos de la imagen original. Sin embargo, su alta dimensionalidad provoca que la búsqueda manual de una direccionalidad que produzca un rasgo o gesto dado resulte impracticable. Este trabajo propone una arquitectura neuronal de tipo pseudo-autoencoder que manipula la proyección latente alternando la apariencia del rostro. Esto se realiza gracias a la codificación del gesto facial con los vectores de Action Units. Se consiguió una dinámica de expresiones que permite la transición de un gesto a otro sin necesidad de pasar por el neutral, mejorando la naturalidad de la dinámica gestual. 

Descargas

Publicado

2022-12-23

Número

Sección

SAIV - Simposio Argentino de Imágenes y Visión

Cómo citar

Aranda, D., Goria, J., Sandalinas, F., Suffern, M., & Negri, P. (2022). Manipulación de Expresiones Faciales vía Espacio Latente de Red Generativa Antagónica (GAN). JAIIO, Jornadas Argentinas De Informática, 8(10), 17-22. https://revistas.unlp.edu.ar/JAIIO/article/view/18307