R

nanobanana é uma skill de CLI em Python para Google Gemini 3 Pro Image que oferece geração de imagem por texto, edição de imagens, proporções de aspecto, saída em 2K/4K e geração em lote com scripts locais simples.

Estrelas654
Favoritos0
Comentários0
Adicionado31 de mar. de 2026
CategoriaImage Generation
Comando de instalação
npx skills add ReScienceLab/opc-skills --skill nanobanana
Pontuação editorial

Esta skill recebeu 78/100, o que a torna uma opção sólida para listagem no diretório: agentes encontram um gatilho de uso claro, comandos concretos e scripts prontos para geração/edição de imagens com Gemini, embora o usuário ainda precise cuidar da configuração e lidar por conta própria com alguma incerteza do modelo.

78/100
Pontos fortes
  • Boa acionabilidade: o frontmatter indica de forma explícita que ela deve ser usada para gerar ou editar imagens com a geração de imagens do Gemini.
  • Concreta do ponto de vista operacional: o SKILL.md traz pré-requisitos, comandos de instalação com pip, exemplos de início rápido, uso da CLI e opções de saída/edição.
  • Vai além do simples prompting no fluxo real de trabalho: os scripts incluídos `generate.py` e `batch_generate.py` oferecem suporte a geração por texto, edição de imagens, proporções de aspecto, saída em 2K/4K e geração em lote.
Pontos de atenção
  • A adoção exige configuração externa: o usuário precisa fornecer `GEMINI_API_KEY` e instalar Python 3.10+, `google-genai` e Pillow.
  • Ainda há limitações de confiança/clareza porque a skill depende de um modelo preview (`gemini-3-pro-image-preview`), e as evidências fornecidas não mostram orientações de troubleshooting, tratamento de erros ou automação de instalação dentro do SKILL.md.
Visão geral

Visão geral da skill nanobanana

Para que serve a nanobanana

A skill nanobanana é uma camada leve sobre o modelo gemini-3-pro-image-preview do Google para geração e edição prática de imagens pela linha de comando. Ela é ideal para quem quer um jeito repetível e automatizável de criar imagens, testar variações de prompt ou gerar saídas em lote sem precisar montar um app completo antes.

Quem deve instalar a nanobanana

O melhor perfil para a skill nanobanana é:

  • desenvolvedores que já usam Python e variáveis de ambiente
  • operadores de IA que querem comandos reprodutíveis de geração de imagens
  • pessoas testando prompts e comparando estilos, proporções e tamanhos de saída
  • usuários que precisam tanto de fluxos de texto-para-imagem quanto de edição de imagem existente

Se você só quer gerar uma imagem ocasionalmente em uma interface de chat, talvez isso exija mais configuração do que o necessário.

O trabalho real que ela resolve

A maioria dos usuários não está procurando “um modelo de imagem” de forma abstrata. O que eles querem é transformar uma ideia criativa inicial em um asset utilizável: uma foto de produto, uma paisagem, um mascote, uma ilustração conceitual ou uma versão editada de uma imagem existente. A nanobanana para Image Generation é útil porque oferece um caminho direto via CLI para esse trabalho, incluindo entrada de prompt, imagem de origem opcional, escolha de proporção e opções de saída em 2K/4K.

O que diferencia a nanobanana de um prompt genérico

O principal diferencial não é um prompt secreto. É a redução de atrito no fluxo de trabalho:

  • um script dedicado para geração e edição
  • flags explícitas para --ratio e --size
  • configuração da API via ambiente
  • suporte a geração em lote em scripts/batch_generate.py
  • um arquivo de referência de prompts com padrões concretos de estilo em references/prompts.md

Isso torna o uso da nanobanana mais consistente do que ficar digitando prompts avulsos manualmente em uma ferramenta de chat genérica.

O que importa antes de adotar

As perguntas principais antes de adotar são simples:

  • Você precisa de uma GEMINI_API_KEY.
  • Você precisa de Python 3.10+.
  • Você precisa de google-genai e pillow.
  • Você deve se sentir à vontade para rodar scripts localmente.
  • Você deve esperar que a qualidade da imagem dependa bastante da especificidade do prompt.

Esta é uma skill prática, não um app web sem configuração.

Como usar a skill nanobanana

Requisitos de instalação da nanobanana

Antes de tentar a instalação da nanobanana, confirme que você tem:

  • Python 3.10+
  • uma GEMINI_API_KEY válida
  • acesso de rede à API do Google
  • os pacotes Python google-genai e pillow

Instale as dependências:

pip install google-genai pillow

Defina sua chave de API:

export GEMINI_API_KEY="your_api_key_here"

Obtenha uma chave em https://aistudio.google.com/apikey.

Instale a skill no seu ambiente de skills

Se você usa o sistema de skills, adicione a skill com:

npx skills add ReScienceLab/opc-skills --skill nanobanana

Após a instalação, leia estes arquivos primeiro:

  • skills/nanobanana/SKILL.md
  • skills/nanobanana/scripts/generate.py
  • skills/nanobanana/references/prompts.md
  • skills/nanobanana/scripts/batch_generate.py

Essa ordem de leitura é o caminho mais rápido para sair de “Será que consigo usar isso?” e chegar em “Quais comandos exatos eu devo rodar?”.

Uso básico da nanobanana para texto-para-imagem

O comando principal é o script de geração com um prompt:

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

Use isso quando você estiver começando apenas com texto. O caminho de saída é opcional, mas defini-lo evita ter que procurar arquivos nomeados automaticamente depois.

Edite uma imagem existente com nanobanana

Para edição de imagem, forneça tanto um prompt quanto uma imagem de entrada:

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

Esse é o fluxo certo quando você quer preservar uma imagem-base e pedir uma alteração pontual. O prompt deve descrever a mudança, não recontar toda a cena, a menos que você queira uma variação maior.

Escolha a proporção e o tamanho de saída

A skill suporta proporções comuns, incluindo:
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9

Exemplo:

python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png

Para resolução mais alta:

python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png

Use a proporção logo no início do fluxo. Ela muda a composição, não apenas o recorte.

Use geração em lote quando explorar prompts for importante

scripts/batch_generate.py é o arquivo mais relevante para decisão depois do script principal, porque permite várias gerações a partir de um único prompt.

Exemplo:

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

Há suporte para geração paralela:

python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5

Isso é especialmente útil quando você está explorando estilo, e não tentando obter uma única saída determinística.

Que tipo de entrada faz a nanobanana funcionar bem

Um objetivo vago como “faça uma imagem legal” geralmente é fraco demais. Entradas melhores incluem:

  • assunto claro
  • estilo pretendido
  • indicações de iluminação ou câmera
  • pistas de composição
  • intenção de qualidade ou de saída

Prompt melhor:

Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background

Prompt mais fraco:

headphones advertisement

A versão mais forte dá mais sinais de controle ao modelo e reduz saídas genéricas.

Transforme uma ideia inicial em um prompt completo

Um guia nanobanana prático para montar prompts é:

  1. nomeie o assunto
  2. especifique o modo visual
  3. adicione detalhes de cena ou composição
  4. adicione iluminação ou clima
  5. acrescente sinais de qualidade apenas se forem úteis

Modelo retirado da referência de prompts do repositório:

Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere

Exemplo:

Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life

Arquivos do repositório que vale ler antes de usar a sério a nanobanana

Se você quer ir além de um uso da nanobanana superficial, revise:

  • SKILL.md para pré-requisitos e padrões de comando
  • references/prompts.md para estruturas de prompt e exemplos por categoria
  • scripts/generate.py para tipos de arquivo suportados, proporções válidas e tamanhos
  • scripts/batch_generate.py para concorrência, atrasos e comportamento de nomeação
  • .claude-plugin/plugin.json para o contexto de empacotamento

Isso é mais útil do que passar o olho na raiz do repositório, porque a skill está concentrada em poucos arquivos.

Restrições práticas e tradeoffs

Limites importantes que os scripts deixam claros:

  • a edição com imagem de entrada depende da disponibilidade do arquivo local
  • arquivos de imagem ausentes ou não suportados falham antes da geração
  • proporções e tamanhos são restritos a valores válidos conhecidos
  • o fluxo depende do modelo de imagem preview do Google, então o comportamento pode mudar com atualizações do modelo
  • a geração em lote aumenta o throughput, mas também eleva o uso de API e a pressão sobre rate limits

Se você precisa de controles avançados de pipeline de imagem, edição baseada em nós ou uma UI hospedada completa, esta skill é intencionalmente mais enxuta.

FAQ da skill nanobanana

A nanobanana é boa para iniciantes

Sim, se você já se sente confortável com comandos básicos de terminal e instalação de pacotes Python. A skill nanobanana é mais simples do que construir seu próprio cliente de API do zero, mas ainda é uma ferramenta voltada a desenvolvedores, não um app de consumo.

Quando devo usar nanobanana em vez de um prompt normal no chat

Use nanobanana quando você precisar de:

  • arquivos de saída salvos
  • comandos repetíveis
  • edição de imagem a partir de arquivos locais
  • geração em lote
  • escolha explícita de proporção e tamanho

Um prompt normal no chat serve para experimentação casual, mas esta skill é melhor quando tratamento de saída e repetibilidade importam.

A nanobanana suporta tanto geração quanto edição

Sim. Ela suporta:

  • geração de texto-para-imagem a partir de prompt
  • edição de imagem com -i / --input
  • controle de proporção
  • configurações de saída 2K e 4K
  • geração em lote por meio de um script separado

Essa combinação é o principal motivo para instalá-la em vez de escrever um prompt avulso.

A nanobanana para Image Generation é suficiente para trabalho de produção

Ela pode ser útil em fluxos próximos de produção, como geração de conceitos, ideação de assets, exploração de prompts ou experimentos de criação em lote. Mas não é, sozinha, um pipeline de produto completo. Você ainda precisa das suas próprias etapas de revisão, seleção, armazenamento e possivelmente pós-processamento.

Quando a nanobanana não é uma boa escolha

Pule a instalação da nanobanana se você precisa de:

  • uma experiência no navegador e sem código
  • um fluxo totalmente gerenciado por GUI
  • orquestração complexa de edição em várias etapas
  • garantias fortes de comportamento estável do modelo ao longo do tempo
  • geração de imagem sem dependência de API externa

Ela funciona melhor como uma camada fina e prática de scripting.

Como melhorar a skill nanobanana

Comece com prompts mais específicos na nanobanana

A forma mais rápida de melhorar os resultados da nanobanana é tornar os prompts mais concretos. Adicione assunto, estilo, composição e iluminação em vez de depender de adjetivos como “legal” ou “bonito”.

Fraco:

a nice city

Mais forte:

Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition

Ajuste o estilo do prompt ao tipo de saída

Use uma linguagem de prompt diferente para objetivos diferentes:

  • pixel art: mencione paleta limitada, pixels nítidos, clima de jogo retrô
  • fotorrealista: mencione lente, iluminação, foco, realismo de materiais
  • ilustração: mencione estilo artístico, paleta, atmosfera, sensação de pincel ou renderização

Esse alinhamento é uma das ideias mais práticas em references/prompts.md.

Melhore a edição de imagem descrevendo só a mudança desejada

Em fluxos de edição, muitos usuários exageram no prompt. Se você já está fornecendo uma imagem de entrada, comece pela modificação específica:

Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent

Isso normalmente funciona melhor do que reescrever a imagem inteira do zero, a menos que você realmente queira uma reinterpretação mais ampla.

Use geração em lote para explorar e depois afunilar

Um bom fluxo iterativo para o uso da nanobanana é:

  1. gerar de 6 a 20 variações com um mesmo tema de prompt
  2. identificar o que funcionou melhor nas melhores saídas
  3. reescrever o prompt com base nessas características vencedoras
  4. rodar novamente com uma descrição de estilo mais fechada ou outra proporção

Isso é melhor do que lapidar indefinidamente um único prompt abstrato antes de ver qualquer saída.

Falhas comuns que merecem atenção

Problemas típicos de qualidade incluem:

  • prompts vagos demais
  • proporção incompatível com o assunto
  • prompts carregados demais, com estilos conflitantes
  • prompts de edição que pedem sem querer uma reescrita completa da cena
  • assumir que 4K sozinho vai corrigir um conceito fraco

A maioria das saídas ruins vem da qualidade da instrução, não da falta de palavras mágicas.

Use a proporção como controle criativo, não como detalhe tardio

Para resultados melhores com a nanobanana para Image Generation:

  • use 1:1 para ícones, avatares e recortes de produto
  • use 9:16 para cenas verticais voltadas a mobile
  • use 16:9 ou 21:9 para paisagens cinematográficas
  • use 4:5 para composições em estilo pôster

Escolher a proporção errada muitas vezes causa enquadramento apertado ou espaço desperdiçado.

Ganhe confiança testando os scripts diretamente

Se a skill parecer pouco clara, rode os scripts você mesmo antes de julgá-la. scripts/generate.py e scripts/batch_generate.py são curtos o suficiente para inspeção, o que ajuda a verificar opções suportadas, caminhos de falha e comportamento de nomeação. Neste repositório, inspecionar os scripts diretamente dá mais confiança do que depender apenas da descrição de alto nível.

Melhor próximo passo se a primeira saída chegou perto, mas não acertou

Não recomece tudo do zero. Mude uma variável por vez:

  • detalhe do assunto
  • frase de estilo
  • indicação de iluminação
  • proporção
  • escopo da instrução de edição

Isso facilita entender a que o modelo está respondendo e melhora rapidamente seu instinto de guia nanobanana para usos futuros.

Avaliações e comentários

Ainda não há avaliações
Compartilhe sua avaliação
Faça login para deixar uma nota e um comentário sobre esta skill.
G
0/10000
Avaliações mais recentes
Salvando...