SIMA 2 es un proyecto de investigación de Google DeepMind que apunta a ampliar el alcance de los agentes de inteligencia artificial más allá del procesamiento de texto o código. La idea es que logren interactuar de manera autónoma dentro de entornos tridimensionales complejos.
A diferencia de sistemas clásicos entrenados para tareas puntuales, este agente está pensado para comprender instrucciones humanas expresadas en lenguaje natural y traducirlas en acciones concretas dentro de mundos virtuales dinámicos. Como pueden ser los videojuegos o las simulaciones 3D. Su objetivo central es demostrar que un mismo sistema puede razonar, planificar y ejecutar conductas de forma flexible, sin depender de reglas rígidas definidas de antemano.
Percepción y análisis
El funcionamiento de SIMA 2 se apoya en modelos avanzados de la familia Gemini. Con dicha tecnología puede interpretar tanto el contexto visual del entorno como las consignas que recibe del usuario.
El agente observa la escena como lo haría una persona frente a una pantalla y, a partir de esa percepción, decide qué pasos seguir para cumplir con la tarea solicitada. Esto incluye moverse por el espacio, interactuar con objetos, usar herramientas virtuales y adaptarse a cambios imprevistos en el entorno.
Acción y explicación
Una de las características más llamativas es su capacidad para transferir conocimientos entre mundos distintos. Aplica aprendizajes previos a situaciones nuevas aunque no sean idénticas. Algo que históricamente fue difícil de lograr en sistemas de este tipo.
Otro aspecto destacable es que SIMA 2 no actúa como una “caja negra” completamente opaca. En muchos casos puede explicar qué planea hacer y por qué tomó determinada decisión. Esto facilita la evaluación de su comportamiento y abre la puerta a una interacción más colaborativa con humanos. Esta combinación de acción y explicación marca una diferencia frente a agentes que solo ejecutan órdenes sin dar contexto sobre su razonamiento interno.
El futuro
Además, el entrenamiento del sistema se basa en la exposición a múltiples mundos virtuales, lo que le permite desarrollar habilidades generales en lugar de optimizarse para un único escenario cerrado.
Aunque SIMA 2 no es un producto comercial ni una herramienta disponible para el público, su valor está en lo que anticipa sobre el futuro de la inteligencia artificial. La posibilidad de contar con agentes capaces de desenvolverse en entornos ricos, cambiantes y visuales es vista como un paso previo hacia aplicaciones más amplias, como asistentes que colaboren en tareas complejas o sistemas que, a largo plazo, puedan trasladar estas capacidades al mundo físico mediante robots.
En ese sentido, SIMA 2 funciona como un laboratorio experimental donde se ponen a prueba ideas clave sobre cómo lograr que la IA aprenda, razone y actúe de manera cada vez más cercana a la experiencia humana.
Opinion compartida
Cabe recordar que hace poco les contamos como una de las figuras más importantes del desarrollo de la inteligencia artificial, Yann Le Cun, había dejado Meta. Entre las razones para su partida estaba la convicción de que los modelos generativos actuales estaban llegando a un límite.
Le Cun señaló que había que cambiar el sistema de entrenamiento a uno basado en entornos virtuales.
Yann LeCun dejaría meta para apostar a un nuevo modelo de IA





