VIE, 25 / NOV / 2022

Stable Diffusion ya tiene una nueva versión

La IA que produce imágenes tiene nuevas opciones que le permiten ofrecer productos más coherentes y con mejor definición. Sin embargo, un filtro que evita la producción de contenido adulto ha generado algo de polémica.

Una nueva versión de Stable Diffusion, la IA que puede producir ilustraciones a pedido, ha sido puesta a disposición del público. Como es de esperar varias mejoras se han incorporado. En general, los usuarios parecen haber encontrado notables y favorables diferencias en los resultados.

Mejoras

Uno de los puntos más importantes es la implementación de un nuevo modulo de interpretación del texto. Según los desarrolladores el resultado es una notable mejora en las imágenes generadas. El modelo de texto a imagen trabaja con resoluciones de 512×512 y 768×768 por defecto.

No más NSFW

Como nota al margen, el sistema de la base de datos está pensado para filtrar el contenido adulto. Es posible imaginar que los desarrolladores han tenido varios motivos para eliminar esta alternativa. El más sencillo de ellos es sacarse un problema de encima ante la posible generación de imágenes subidas de tono en contextos no deseados.

Quizás en el futuro se publique una variante sin este filtro. Por lo pronto mucha gente ha criticado esta decisión.

Resolución mejorada

El sistema incorpora una función de mejora de la resolución que permite mejorar las imágenes con menor densidad (pasar de 128×128 a 512×512). En combinación con otras herramientas permite generar imágenes de más de 2048×2048.

Mejor comprensión de las estructuras

Esta nueva versión también es capaz de entender mejor la estructura de una imagen y ofrecer de esta manera transformaciones más profundas manteniendo el nivel de coherencia. La imagen ilustrativa que han publicado los desarrolladores explica el concepto con bastante claridad. Se trata de distinguir detalle y forma.

Optimización

Los desarrolladores también han destacado que siguen trabajando para que Stable Diffusion pueda desenvolverse mejor en equipos con un solo GPU. La idea es que la herramienta sea accesible a la mayor cantidad posible de personas.

¡Comparte esta noticia!