R

nanobanana es una skill de CLI en Python para Google Gemini 3 Pro Image que permite generar imágenes desde texto, editar imágenes, definir relaciones de aspecto, obtener salida en 2K/4K y realizar generación por lotes con scripts locales sencillos.

Estrellas654
Favoritos0
Comentarios0
Agregado31 mar 2026
CategoríaImage Generation
Comando de instalación
npx skills add ReScienceLab/opc-skills --skill nanobanana
Puntuación editorial

Esta skill obtiene 78/100, lo que la convierte en una candidata sólida para el directorio: ofrece a los agentes un activador claro, comandos concretos y scripts ejecutables para generación y edición de imágenes con Gemini, aunque los usuarios siguen teniendo que resolver por su cuenta la configuración y cierta incertidumbre propia del modelo.

78/100
Puntos fuertes
  • Alta capacidad de activación: el frontmatter indica explícitamente que debe usarse para generar o editar imágenes con la generación de imágenes de Gemini.
  • Concreción operativa: `SKILL.md` incluye requisitos previos, comandos de instalación con pip, ejemplos de inicio rápido, uso de la CLI y opciones de salida y edición.
  • Aporta valor real al flujo de trabajo más allá del prompting: los scripts incluidos `generate.py` y `batch_generate.py` permiten generación de texto a imagen, edición de imágenes, relaciones de aspecto, salida en 2K/4K y generación por lotes.
Puntos a tener en cuenta
  • La adopción requiere configuración externa: los usuarios deben proporcionar `GEMINI_API_KEY` e instalar Python 3.10+, `google-genai` y Pillow.
  • Persisten algunas limitaciones de confianza y claridad porque la skill depende de un modelo en vista previa (`gemini-3-pro-image-preview`) y la evidencia disponible no muestra resolución de problemas, guía sobre modos de error ni automatización de la instalación dentro de `SKILL.md`.
Resumen

Visión general de nanobanana skill

Para qué sirve nanobanana

La nanobanana skill es una capa ligera sobre el modelo gemini-3-pro-image-preview de Google para generar y editar imágenes de forma práctica desde la línea de comandos. Encaja especialmente bien para quienes buscan una manera repetible y automatizable de crear imágenes, probar variaciones de prompt o generar lotes de salidas sin tener que construir primero una aplicación completa.

Quién debería instalar nanobanana

El mejor encaje para la nanobanana skill es:

  • desarrolladores que ya trabajan con Python y variables de entorno
  • operadores de IA que quieren comandos reproducibles para generación de imágenes
  • personas que prueban prompts y comparan estilos, relaciones de aspecto y tamaños de salida
  • usuarios que necesitan tanto flujos de texto a imagen como edición de una imagen existente

Si solo quieres generar alguna imagen puntual en una interfaz de chat, puede que requiera más configuración de la que realmente necesitas.

El trabajo real que resuelve

La mayoría de usuarios no están buscando “un modelo de imagen” en abstracto. Lo que quieren es convertir una idea creativa inicial en un recurso utilizable: una foto de producto, un paisaje, una mascota, una ilustración conceptual o una versión editada de una imagen existente. nanobanana for Image Generation resulta útil porque ofrece una vía directa por CLI para ese trabajo, incluyendo entrada de prompt, imagen de origen opcional, selección de relación de aspecto y opciones de salida en 2K/4K.

Qué hace diferente a nanobanana frente a un prompt genérico

Su principal diferenciador no es un prompting secreto. Es la reducción de fricción en el flujo de trabajo:

  • un script dedicado para generación y edición
  • flags explícitos para --ratio y --size
  • configuración de API basada en entorno
  • soporte para generación por lotes en scripts/batch_generate.py
  • un archivo de referencia de prompts con patrones de estilo concretos en references/prompts.md

Eso hace que el uso de nanobanana sea más consistente que escribir a mano prompts improvisados una y otra vez en una herramienta de chat generalista.

Qué importa antes de adoptarlo

Las preguntas clave de adopción son simples:

  • Necesitas una GEMINI_API_KEY.
  • Necesitas Python 3.10+.
  • Necesitas google-genai y pillow.
  • Conviene sentirte cómodo ejecutando scripts locales.
  • Debes asumir que la calidad de imagen dependerá mucho de la especificidad del prompt.

Es una skill práctica, no una aplicación web sin configuración.

Cómo usar nanobanana skill

Requisitos de instalación de nanobanana

Antes de probar nanobanana install, asegúrate de tener:

  • Python 3.10+
  • una GEMINI_API_KEY válida
  • acceso de red a la API de Google
  • los paquetes de Python google-genai y pillow

Instala las dependencias:

pip install google-genai pillow

Configura tu API key:

export GEMINI_API_KEY="your_api_key_here"

Puedes obtener una clave en https://aistudio.google.com/apikey.

Instala la skill en tu entorno de skills

Si usas el sistema de skills, añade la skill con:

npx skills add ReScienceLab/opc-skills --skill nanobanana

Después de instalarla, lee primero estos archivos:

  • skills/nanobanana/SKILL.md
  • skills/nanobanana/scripts/generate.py
  • skills/nanobanana/references/prompts.md
  • skills/nanobanana/scripts/batch_generate.py

Este orden de lectura te da la vía más rápida para pasar de “¿me sirve?” a “¿qué comandos exactos tengo que ejecutar?”.

Uso básico de nanobanana para texto a imagen

El comando principal es el script de generación con un prompt:

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

Úsalo cuando partes solo de texto. La ruta de salida es opcional, pero definirla evita tener que buscar después archivos con nombres generados automáticamente.

Editar una imagen existente con nanobanana

Para editar imágenes, proporciona tanto un prompt como una imagen de entrada:

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

Este es el flujo adecuado cuando quieres conservar una imagen base y pedir un cambio concreto. El prompt debe describir el cambio, no volver a describir toda la escena, salvo que busques una variación más amplia.

Elegir relación de aspecto y tamaño de salida

La skill admite relaciones de aspecto habituales, entre ellas:
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9

Ejemplo:

python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png

Para mayor resolución:

python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png

Conviene fijar la relación de aspecto al principio del flujo. Cambia la composición, no solo el recorte.

Usa la generación por lotes cuando la exploración de prompts importa

scripts/batch_generate.py es el archivo más relevante para tomar una decisión después del script principal, porque permite múltiples generaciones a partir de un solo prompt.

Ejemplo:

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

También admite generación en paralelo:

python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5

Esto resulta especialmente útil cuando estás explorando estilo, no persiguiendo una única salida determinista.

Qué tipo de entrada hace que nanobanana funcione bien

Un objetivo vago como “haz una imagen chula” suele quedarse corto. Las entradas más sólidas incluyen:

  • un sujeto claro
  • el estilo deseado
  • pistas de iluminación o cámara
  • indicaciones de composición
  • intención de calidad o de salida

Mejor prompt:

Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background

Prompt más débil:

headphones advertisement

La versión más sólida da al modelo más señales de control y reduce las salidas genéricas.

Convierte una idea inicial en un prompt completo

Una guía de nanobanana práctica para construir prompts es:

  1. nombra el sujeto
  2. especifica el modo visual
  3. añade detalles de escena o composición
  4. añade iluminación o ambiente
  5. añade indicadores de calidad solo si aportan valor

Plantilla tomada de la referencia de prompts del repo:

Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere

Ejemplo:

Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life

Archivos del repositorio de nanobanana que conviene leer antes de un uso serio

Si quieres ir más allá de un uso de nanobanana superficial, revisa:

  • SKILL.md para requisitos previos y patrones de comandos
  • references/prompts.md para estructuras de prompt y ejemplos por categoría
  • scripts/generate.py para tipos de archivo compatibles, relaciones válidas y tamaños
  • scripts/batch_generate.py para concurrencia, pausas y comportamiento de nombrado
  • .claude-plugin/plugin.json para el contexto de empaquetado

Esto resulta más útil que hojear la raíz del repo, porque la skill está concentrada en unos pocos archivos.

Límites prácticos y tradeoffs

Los scripts dejan claras varias limitaciones importantes:

  • la edición de imágenes de entrada depende de que el archivo local esté disponible
  • los archivos de imagen no compatibles o ausentes fallarán antes de la generación
  • las relaciones y tamaños están restringidos a valores válidos conocidos
  • el flujo depende del modelo de imagen preview de Google, así que el comportamiento puede cambiar con actualizaciones del modelo
  • la generación por lotes aumenta el rendimiento, pero también el uso de API y la posible presión por rate limits

Si necesitas controles avanzados de pipeline de imagen, edición basada en nodos o una interfaz alojada completa, esta skill es intencionadamente más limitada.

Preguntas frecuentes sobre nanobanana skill

¿Es nanobanana bueno para principiantes?

Sí, siempre que te manejes con comandos básicos de terminal e instalación de paquetes de Python. La nanobanana skill es más sencilla que construir tu propio cliente de API desde cero, pero sigue siendo una herramienta orientada a desarrolladores, no una app de consumo.

¿Cuándo debería usar nanobanana en vez de un prompt normal en chat?

Usa nanobanana cuando necesites:

  • archivos de salida guardados
  • comandos repetibles
  • edición de imágenes desde archivos locales
  • generación por lotes
  • selección explícita de relación de aspecto y tamaño

Un prompt normal en chat sirve para experimentación casual, pero esta skill funciona mejor cuando importan la gestión de salidas y la repetibilidad.

¿nanobanana admite tanto generación como edición?

Sí. Admite:

  • generación de texto a imagen a partir de un prompt
  • edición de imágenes con -i / --input
  • control de relación de aspecto
  • ajustes de salida 2K y 4K
  • generación por lotes mediante un script aparte

Esa combinación es la principal razón para instalarla en lugar de escribir un prompt aislado.

¿Es nanobanana for Image Generation suficiente para trabajo de producción?

Puede ser útil en flujos cercanos a producción, como generación conceptual, ideación de recursos, exploración de prompts o experimentos de creación por lotes. Pero por sí sola no constituye un pipeline de producto completo. Sigues necesitando tus propios pasos de revisión, selección, almacenamiento y, posiblemente, postprocesado.

¿Cuándo encaja mal nanobanana?

Omite nanobanana install si necesitas:

  • una experiencia no-code centrada en navegador
  • un flujo GUI totalmente gestionado
  • una orquestación compleja de edición en varios pasos
  • garantías fuertes sobre un comportamiento estable del modelo a lo largo del tiempo
  • generación de imágenes sin dependencia de una API externa

Su punto fuerte es ser una capa de scripting fina y práctica.

Cómo mejorar nanobanana skill

Empieza por una mayor especificidad en los prompts

La forma más rápida de mejorar los resultados de nanobanana es hacer los prompts más concretos. Añade sujeto, estilo, composición e iluminación en lugar de apoyarte en adjetivos como “chulo” o “bonito”.

Débil:

a nice city

Más sólido:

Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition

Ajusta el estilo del prompt al tipo de salida

Usa un lenguaje de prompt distinto según el objetivo:

  • pixel art: menciona paleta limitada, píxeles definidos, aire de juego retro
  • fotorrealista: menciona lente, iluminación, enfoque y realismo de materiales
  • ilustración: menciona estilo artístico, paleta, atmósfera y sensación de pincel o renderizado

Esta alineación es una de las ideas más prácticas de references/prompts.md.

Mejora la edición de imágenes describiendo solo el cambio deseado

En flujos de edición, muchos usuarios se exceden con el prompt. Si ya proporcionas una imagen de entrada, empieza por la modificación concreta:

Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent

Normalmente esto funciona mejor que reescribir la imagen entera desde cero, salvo que realmente busques una reinterpretación más amplia.

Usa la generación por lotes para explorar y luego acotar

Un buen flujo iterativo para el uso de nanobanana es:

  1. genera entre 6 y 20 variaciones con un mismo tema de prompt
  2. identifica qué funcionó en las mejores salidas
  3. reescribe el prompt alrededor de esos rasgos ganadores
  4. vuelve a ejecutar con una descripción de estilo más cerrada o una relación distinta

Esto funciona mejor que pulir sin fin un único prompt abstracto antes de ver ninguna salida.

Fallos habituales que conviene vigilar

Los problemas de calidad más típicos incluyen:

  • prompts demasiado vagos
  • una relación de aspecto que no encaja con el sujeto
  • prompts sobrecargados con estilos en conflicto
  • prompts de edición que sin querer piden reescribir toda la escena
  • asumir que 4K por sí solo arreglará una idea débil

La mayoría de malas salidas vienen de la calidad de las instrucciones, no de la falta de palabras mágicas.

Usa la relación de aspecto como control creativo, no como detalle final

Para obtener mejores resultados con nanobanana for Image Generation:

  • usa 1:1 para iconos, avatares y recortes de producto
  • usa 9:16 para escenas verticales pensadas para móvil
  • usa 16:9 o 21:9 para paisajes cinematográficos
  • usa 4:5 para composiciones tipo póster

Elegir mal la relación de aspecto suele provocar encuadres apretados o espacio desperdiciado.

Mejora la confianza probando los scripts directamente

Si una skill te genera dudas, ejecuta los scripts tú mismo antes de valorarla. scripts/generate.py y scripts/batch_generate.py son lo bastante cortos como para inspeccionarlos, lo que te ayuda a verificar opciones compatibles, rutas de fallo y comportamiento de nombrado. En este repo, revisar los scripts directamente da más confianza que depender solo de la descripción de alto nivel.

La mejor mejora siguiente si tu primera salida está cerca, pero no acierta

No reinicies por completo. Cambia una variable cada vez:

  • detalle del sujeto
  • frase de estilo
  • indicación de iluminación
  • relación de aspecto
  • alcance de la instrucción de edición

Eso hace más fácil entender a qué está respondiendo el modelo y mejora rápidamente tu intuición futura con cualquier guía de nanobanana.

Calificaciones y reseñas

Aún no hay calificaciones
Comparte tu reseña
Inicia sesión para dejar una calificación y un comentario sobre esta skill.
G
0/10000
Reseñas más recientes
Guardando...