Comparación de métodos Zero-shot Proxy en la Búsqueda de Arquitecturas de Redes Neuronales basada en Algoritmos Genéticos y aplicados en la Clasificación de Imágenes

Autores/as

  • Eduardo Centurión Funes Universidad Nacional de Asunción, Paraguay
  • José D. Colbes Sanabria Universidad Nacional de Asunción, Paraguay
  • Diego P. Pinto-Roa Universidad Nacional de Asunción, Paraguay

Palabras clave:

Búsqueda de Arquitecturas de Redes Neuronales, Zero-shot Proxy, Algoritmos Genéticos

Resumen

La Búsqueda de Arquitecturas de Redes neuronales (NAS, Neural Architecture Search) es una línea de investigación fundamental para aplicaciones de Redes Neuronales Convolucionales (CNN, Convolutional Neural Network) de alto rendimiento. Normalmente, los métodos NAS propuestos en la literatura requieren un alto costo computacional para calcular la solución CNN óptima dentro de los problemas de clasificación de imágenes. Por lo tanto, una línea de investigación emergente propone estimadores de rendimiento llamados métodos Zero-Shot Proxy. Las métodos Zero-Shot Proxy reducen el costo de evaluación dentro de la búsqueda de la arquitectura óptima, reemplazando parcial o completamente el entrenamiento y evaluación. Claramente, estos métodos ayudan a reducir el costo computacional, sin embargo, es necesario examinar su impacto en NAS. Este trabajo estudia el efecto de métodos Zero-Shot Proxy del estado del arte –Gradient norm, SNIP, Synflow, GraSP, Fisher information, y Jacobian covariant– como guías estratégicas en un Algoritmo Genético. La simulación experimental en la base de datos CIFAR10 indica el buen rendimiento de los métodos considerados, siendo el Jacobian covariant el más preciso.

Descargas

Publicado

2024-09-19

Número

Sección

ASAID - Simposio Argentino de Inteligencia Artificial y Ciencias de Datos

Cómo citar

Centurión Funes, E., Colbes Sanabria, J. D., & Pinto-Roa, D. P. (2024). Comparación de métodos Zero-shot Proxy en la Búsqueda de Arquitecturas de Redes Neuronales basada en Algoritmos Genéticos y aplicados en la Clasificación de Imágenes. JAIIO, Jornadas Argentinas De Informática, 10(1), 167-180. https://revistas.unlp.edu.ar/JAIIO/article/view/17911