TODO SOBRE GOOGLE NANO BANANA

DOM, 14 / SEP / 2025

Te contamos todo sobre “Nano Banana”, nombre en clave de Gemini 2.5 Flash Image, el nuevo modelo de Google para edición y generación visual guiada por texto, su disponibilidad, capacidades, límites, costos y medidas de seguridad para trazabilidad y uso responsable.

Autor: Claudio Peña

Qué es Nano Banana y su lugar en Gemini

Nano Banana es el alias interno de Gemini 2.5 Flash Image, un modelo de Google dedicado a manipulación visual que mantiene coherencia con la familia Gemini y se diferencia de herramientas previas como Imagen al integrarse de forma nativa con app, API y servicios en la nube de la compañía.

El apodo trascendió cuando Sundar Pichai publicó emojis de banana, mientras que el nombre oficial subraya su orientación a rapidez y bajo costo computacional, especializado en editar fotos, fusionar elementos y crear imágenes a partir de instrucciones en lenguaje natural.

En el ecosistema, convive con variantes de texto y multimodales, pero se concentra en la dimensión visual, interoperando con la aplicación móvil, la API de Gemini y Vertex AI, lo que le permite escalar desde pruebas personales hasta flujos productivos empresariales.

El gesto de Sundar Pichai funcionó como un guiño a la comunidad tecnológica y despertó especulaciones sobre el inminente lanzamiento de un nuevo modelo de imágenes. Este uso de símbolos simples para anticipar un anuncio refl eja cómo Google combina comunicación técnica con referencias ligeras que captan la atención del público.

Lanzamiento, acceso y flujo de uso

Presentado en agosto de 2025, su acceso para el público se canaliza por la app Gemini en web y móviles, donde cualquiera puede cargar imágenes y describir cambios por texto con resultados inmediatos; para desarrolladores, ofrece Gemini API, Google AI Studio y soporte en Vertex AI.

En su debut se liberó como “preview”, con alcance por regiones y ajustes previstos a estabilidad y cobertura, y con miras a integraciones con Google Drive o Google Photos para workflows donde la edición asistida conviva con almacenamiento y organización.

El uso típico arranca subiendo una imagen base, con opción de delimitar áreas mediante masking; el núcleo es el prompt, que el sistema interpreta para aplicar transformaciones y devolver una primera versión editable en iteraciones sucesivas.

Además del texto, incorpora parámetros como temperatura para controlar aleatoriedad, variabilidad para explorar alternativas en paralelo y masking para acotar zonas, logrando un balance entre control humano y generación automática y acelerando el ida y vuelta hasta un resultado que convenza.

Vertex AI, la plataforma empresarial de inteligencia artificial de Google Cloud, incorpora Nano Banana como un recurso adicional dentro de sus servicios, lo que facilita a organizaciones escalar proyectos de producción basados en este modelo.

Capacidades, límites, comparación, seguridad y costos

Entre sus funciones clave destacan la edición guiada por texto, la consistencia de sujetos a través de múltiples imágenes, la fusión de fotos y composiciones con iluminación y perspectiva coherentes, y la transferencia/mezcla de estilos (style transfer) que permite convertir fotos en “óleo”, cómic o híbridos estéticos.

Aunque exhibe mejoras en coherencia, aún sufre con detalles finos como cabellos en movimiento, reflejos o tipografía extensa, y puede quedar por detrás de modelos hiperrealistas en texturas extremas; su fortaleza reside en la combinación de velocidad, continuidad entre ediciones y accesibilidad, con perspectivas de mejora en memoria de contexto y módulos específicos para tipografía y detalles complejos.

Para trazabilidad, integra SynthID, una marca de agua invisible embebida en los píxeles durante la generación, resistente a recortes, cambios de tamaño y ajustes de color, con herramientas de verificación que facilitan confirmar procedencia en prensa y publicidad.

El despliegue viene acompañado de políticas de uso responsable que restringen contenidos dañinos y de debates regulatorios sobre marcado de IA y sanciones a deepfakes, promoviendo una responsabilidad compartida entre empresas, plataformas y estados.

En costos, la app Gemini ofrece cupos gratuitos acotados según región y versión; a escala, la API y Vertex AI facturan por consumo: US$ 30 por millón de output tokens, con una referencia de ~1.290 tokens por imagen (≈ US$ 0,039), lo que habilita desde ediciones ocasionales de unos pocos dólares al mes hasta volúmenes empresariales de cientos o miles según complejidad y cantidad.

A la izquierda vemos la imagen original y a la derecha el resultado entregado por Nano Banana, ante la instrucción: “transforma esta imagen en una caricatura del estilo Los Simpsons”.

Encuentra la versión completa de la publicación en la que se basa este resumen, con todos los detalles técnicos en RedUSERS PREMIUM

También te puede interesar:

DEEPMIND EL FUTURO SEGUN GOOGLE

En poco más de una década, DeepMind pasó de ser una joven empresa londinense a convertirse en el motor de investigación en inteligencia artificial de Google. Este resumen explora su evolución tecnológica, los sistemas pioneros que impulsó y los dilemas éticos y geopolíticos que acompañan su expansión.


Lee todo lo que quieras, donde vayas, contenidos exclusivos por una mínima cuota mensual. Solo en RedUSERS PREMIUM: SUSCRIBETE!


Comentarios
¡Comparte esta noticia!

Leave a Reply