JUE, 30 / ABR / 2026

ChatGPT y la invasión de goblines

La IA de OpenAI tuvo durante un buen tiempo una creciente presencia de ciertas metáforas que usaban términos de criaturas de fantasía. A los investigadores les llevó un buen tiempo descubrir las causas.

OpenAI ha tenido, desde la versión 5.1 de ChatGPT, un curioso problema con los góblines, los gremlins y otras criaturas supernaturales. Las menciones a tales seres han aumentado día a día, poco a poco. Han continuado aún a través de las siguiente iteraciones del modelo, apareciendo en cuanta metáfora fuera posible. Con el tiempo los desarrolladores se preguntaron por las razones del fenómeno e iniciaron una investigación. Recientemente OpenAI ha publicado un informe de todo lo ocurrido.

El origen

Los desarrolladores apuntan que hay muchas razones para la proliferación de los goblines. Una multitud de incentivos que ha hecho que las IA los tenga tan en cuenta. Uno de los puntos claves ha sido la introducción de una personalidad con tendencias vinculadas a lo que Estados Unidos define como cultura Nerd. De allí vienen los primeros goblines.

Fue con el lanzamiento de ChatGPT 5.1 que la mención a estas criaturas aumentó un 175%. Pero aún en ese momento no era nada que mereciera demasiada atención. Luego del lanzamiento de ChatGPT 5.4 se produjo un nuevo aumento en las referencias. Una vez más, eran parte de una forma de hablar muy típica de quienes utilizaban la personalidad Nerd para la IA. La IA con esta personalidad concentraba el 2,5% de las respuestas de ChatGPT, y el 66,7% de las que contenían el término goblin.

Los investigadores apuntan que con cada iteración de ChatGPT había más goblines. Por dicha razón comenzaron a sospechar que había algo en el mecanismo con el que creaban las personalidades que amplificaba el fenómeno. Descubrieron que el sistema de recompensas ofrecía un estímulo mayor para las respuestas que incluían estos términos que las que ofrecían otros de un carácter más positivo.

Nada los detiene

Ahora bien, todavía tenían que revelar porque el término se había difundido más allá de las consignas marcadas para ofrecer los rasgos Nerd. La proporción en el crecimiento de la presencia del término era igual en respuestas que estaban vinculada y no vinculadas a la personalidad.

La conclusión a la que llegaron los técnicos fue que se había producido una transferencia. El sistema de aprendizaje no garantizaba una aplicación limitada. Una vez que una costumbre es recompensada puede aparecer en otros lugares, sobre todo cuando las respuestas son utilizadas en procesos de refinamiento.

¿El fin de los goblins?

La personalidad Nerd se retiró en ChatGPT 5.4. También se eliminaron las recompensas relacionadas con el término goblin y otros similares, y se filtró el material que contenía el término de los archivos de entrenamiento.

Sin embargo, ChatGPT 5.5 comenzó su entrenamiento antes de que se descubrieran las causas de la invasión goblin y estos cambios se realizaran. Y por esos estas criaturas y otros seres tales como trols, ogros y por alguna razón mapaches, también aparecían a menudo en Codex.

Los desarrolladores terminaron agregando instrucciones para mitigar este efecto. Sin embargo, ha señalado que es posible desactivar esta medida y publicado el código necesario para tal efecto.

Lo curioso es que este simple incidente con goblines ha hecho que los investigadores aprendan mucho sobre la IA.

Comentarios