JUE, 22 / JUN / 2023

Desarrollan sistema capaz de identificar y crear imágenes

Aunque existen buenas herramientas para ambas operaciones, todas ellas estan especializadas en una u otra tarea. MAGE combina ambos mecanismos.

El laboratorio de inteligencia artificial y ciencias de la computación del MIT ha anunciado la creación de MAGE, un sistema visual capaz de realizar tareas de reconocimiento y generación de imágenes.

Hasta ahora muchas herramientas de gran nivel han sido desarrolladas para cada una de estas funciones. Pero la creación del MIT es la primera que las combina, lo que supone un entrenamiento unificado.

Dos procesos separados

Aunque en ambos casos hay un análisis visual, los procesos de generación e identificación utilizan técnicas diferentes.

La generación implica tomar una cantidad pequeña de datos, una consigna, y generar un producto con una gran nivel de información, una imagen. La identificación toma una gran cantidad de información y la reduce a un resultado sencillo, el etiquetado o clasificación.

El nuevo modelo

El nuevo esquema desarrollado es complejo. Secciones de una imagen son convertidas en tokens semánticos. Como pequeñas piezas de un rompecabezas.

Una vez que estas piezas estuvieron listas los desarrolladores ocultaron algunas al azar.

Una red neuronal fue entrenada para predecir los tokens ocultos en base al contexto (otros tokens que lo rodean). Con esta técnica MAGE aprendió a reconocer los patrones y generar nuevas imágenes.

Así pues, cuanto más oculta está una imagen más cercano el proceso está a una mecánica de reconstrucción, cuanto más expuesta más cerca de un proceso de codificación. Pero en esencia es una combinación de ambas mecánicas.

Comentarios