Investigadores de Microsoft crearon un mercado online de pruebas, el Magentic Marketplace. Esta simulación de código abierto tiene como objetivo poner a prueba a los agentes de IA que en el futuro podrían ayudar a las personas a hacer compras.
En este ambiente controlado se reprodujeron transacciones tales como la contratación de servicios o la compra de alimentos. Algunas IA tomaron el rol de agentes de consumidores y otras de los negocios. En cada iteración hubo 100 clientes virtuales y 300 negocios virtuales. Se emplearon tanto modelos privados como de código abierto.
Demasiadas opciones y manipulación
El trabajo mostró que los agentes podían ser de ayuda, porque pueden considerar más posibilidades que los seres humanos. Sin embargo, en numerosas ocasiones, a pesar de tener más alternativas y resultados de búsqueda a menudo se quedaban con la alternativa que originalmente les había parecido suficientemente buena. En efecto, aún las IA parecían cansarse con el tiempo y tener ganas de comprar algo y dedicarse luego a otra cosa. Cabe aclarar que algunas versiones de Gemini y ChatGPT mostraron mayor esfuerzo.
Por otro lado, varios modelos demostraron ser vulnerables a las consignas ocultas (prompt injection), pero otras técnicas de manipulación más sencillas también fueron efectivas.
Conclusión
Microsoft apunta que los agentes de IA pueden emplearse como herramientas de asistencia, pero no están todavía en un estado de desarrollo que les permita manejarse por su cuenta con seguridad. Necesitan la supervisión humana, como los autos que se manejan solos, pero cuyo volante tiene que estar al alcance de la mano.





