JUE, 7 / MAR / 2024

Genie: la IA que crea juegos en base a una sola imagen

Los resultados son poco más que experimentos, pero la herramientas es interesante. Por el momento se ha enfocado en los juegos de plataformas, pero el modelo puede ampliarse.

A fines de febrero los desarrolladores de DeepMind presentaron a Genie, un modelo de inteligencia artificial que crearon en colaboración con la Universidad de Columbia Británica. Esta IA tiene la capacidad de producir juegos en dos dimensiones a partir de una única imagen.

Captura del juego generado por Genie a través de una imagen.

Cada imagen, un mundo

Genie toma una imagen y la utiliza para generar un personaje principal y un mundo con un paisaje de fondo y plataformas por las que el personaje puede moverse. El mundo se extiende mucho más allá del cuadro original. No hay muchos límites para la imagen, lo que permite que permite que fotógrafos, artistas y aficionados puedan crear escenarios y luego interactuar en ese espacio de su imaginación.

Juegos generados por imágenes digitales. Las capturas en la fila inferior.

 

Juego generados a través de dibujos. La captura del juego en la parte inferior.

Los juegos no son muy complejos y todos pertenecen al mismo género de plataformas. No hay mucha variación o riqueza en las mecánicas. Este límite tiene una explicación sencilla, los desarrolladores se han concentrado en este género al entrenar a la IA con un base de datos pública de videos relacionados con este tipo de juegos.

El método, aclaran, puede escalarse a bases de datos mayores y a otros tipos de juegos.

El método y sus resultados

Los desarrolladores destacan que Genie no necesita que se identifiquen las acciones que se están realizando en la pantalla. También su capacidad para simular cambios en la forma de los objetos (aunque en los juegos de plataforma esta opción no luce mucho).

Para la producción de los juegos se construyó una aplicación capaz de aplicar tokens a una gran cantidad de parámetros en los cuadros de un video. De esta manera, tras el entrenamiento, el sistema era capaz de predecir lo que iba a ocurrir en el siguiente cuadro de una escena. Podía leer las acciones latentes. Luego se agregó un modulo capaz de producir los cuadros predichos.

El resultado es por el momento apenas funcional. Los movimientos son hasta 30 veces más lentos de los que se producen en un videojuego normal y los errores son frecuentes con algunas creaciones siendo prácticamente no funcionales. Aún así, el desarrollo tiene potencial y es interesante.

¡Comparte esta noticia!
TAGS