MIE, 6 / AGO / 2025

OpenAI lanza dos nuevos modelos de “peso abierto”

El OSS 120b y el OSS 20b son relativamente pequeños. La información sobre los parámetros de comportamiento es de acceso público. Amazon ya ha adelantado que los ofrecerá en su mercado de AWS.

OpenAI ha lanzado dos nuevos modelos al mercado que destacan por su accesibilidad en términos de requisitos de hardware y una mayor apertura y libertad de uso. El más grande es el GPT OSS 120b, que puede funcionar con un soolo GPU y con una exigencia de 80GB de RAM. El más pequeño, el GPT OSS 20b puede operar desde una computadora personal, con unos 16GB de RAM.

Según la compañía ambos modelos ofrecen un rendimiento similar al de los o3-mini y 04-mini. También se ha señalado que se destacan en matemáticas, programación y consultas de salud. Fueron entrenados con una base de datos de texto, mayormente en inglés y enfocada en las ciencias duras. Carecen de las capacidades visuales de GPT 4o.

Los dos modelos permiten ajustar el nivel de esfuerzo en razonamiento.

Abierto pero no tanto

Una característica de este lanzamiento es que es el primero, desde GPT 2, en el que se publican los pesos que determinan el modo en que se comporta el modelo. Esta información permite entender mejor el comportamiento de la IA y adaptarla para ciertas tareas. Sin embargo, es importante destacar que esta alternativa en la publicación es diferente a una de código abierto. Ni el código de entrenamiento ni la base de datos empleada para dicha tarea están al alcance del público.

La información provistas sigue siendo valiosa dado que los modelos salen con licencia Apache 2.0, lo que le permite a los usuarios usar las IA casi como se les de la gana.

Amazon

Por su parte, Amazon ha anunciado que ambos modelos estarán disponible en el mercado de AWS. La compañía no ha dado detalles sobre el acuerdo al que ha llegado con OpenAI, simplemente ha manifestado que cree que las IA producidas son excelentes soluciones.

Comentarios
¡Comparte esta noticia!
TAGS

Comments are closed.