nanobanana

par ReScienceLab

nanobanana est une skill CLI Python pour Google Gemini 3 Pro Image, avec génération texte-vers-image, retouche d’images, gestion des ratios, sortie 2K/4K et génération par lots via de simples scripts locaux.

Étoiles654

Favoris0

Commentaires0

Ajouté31 mars 2026

CatégorieImage Generation

Commande d’installation

npx skills add ReScienceLab/opc-skills --skill nanobanana

Score éditorial

Cette skill obtient 78/100, ce qui en fait une fiche solide pour l’annuaire : les agents disposent d’un déclencheur clair, de commandes concrètes et de scripts exécutables pour la génération et la retouche d’images avec Gemini, même si les utilisateurs doivent encore gérer eux-mêmes la configuration et une part d’incertitude liée au modèle.

78/100

Points forts

Excellente capacité de déclenchement : le frontmatter indique explicitement de l’utiliser pour générer ou retoucher des images avec la génération d’images Gemini.
Concrète sur le plan opérationnel : `SKILL.md` inclut les prérequis, les commandes d’installation `pip`, des exemples de démarrage rapide, l’usage en CLI et les options de sortie et de retouche.
Un vrai levier de workflow au-delà du simple prompting : les scripts inclus `generate.py` et `batch_generate.py` prennent en charge le texte-vers-image, la retouche d’images, les ratios, la sortie 2K/4K et la génération par lots.

Points de vigilance

L’adoption demande une configuration externe : les utilisateurs doivent fournir `GEMINI_API_KEY` et installer Python 3.10+, `google-genai` et Pillow.
Certaines limites de confiance et de clarté subsistent, car la skill repose sur un modèle en preview (`gemini-3-pro-image-preview`) et les éléments fournis ne montrent ni dépannage, ni guide sur les modes d’erreur, ni automatisation de l’installation dans `SKILL.md`.

Gemini Google Python Cli Workflow Batch Jobs

Vue d’ensemble

Vue d’ensemble de la compétence nanobanana

À quoi sert nanobanana

La compétence nanobanana est une surcouche légère du modèle gemini-3-pro-image-preview de Google, pensée pour la génération et l’édition d’images en pratique depuis la ligne de commande. Elle convient particulièrement à celles et ceux qui veulent une méthode reproductible et scriptable pour créer des images, tester des variantes de prompts ou générer des lots de sorties sans devoir construire une application complète au préalable.

À qui s’adresse l’installation de nanobanana

La compétence nanobanana est particulièrement adaptée :

aux développeurs qui utilisent déjà Python et les variables d’environnement
aux opérateurs IA qui veulent des commandes de génération d’images reproductibles
aux personnes qui testent des prompts et comparent styles, ratios et tailles de sortie
aux utilisateurs qui ont besoin à la fois de workflows text-to-image et de modification d’image existante

Si vous cherchez seulement à générer ponctuellement quelques images dans une interface de chat, la mise en place risque d’être plus lourde que nécessaire.

Le besoin concret auquel répond nanobanana

La plupart des utilisateurs ne cherchent pas « un modèle d’image » de manière abstraite. Ils veulent transformer une intention créative encore floue en ressource exploitable : photo produit, paysage, mascotte, illustration conceptuelle ou version retouchée d’une image existante. nanobanana pour la génération d’images est utile précisément parce qu’il offre un chemin direct en CLI pour ce besoin, avec saisie du prompt, image source en option, choix du ratio et sorties en 2K/4K.

Ce qui différencie nanobanana d’un prompt générique

Le vrai différenciateur n’est pas un prompting secret. C’est la réduction de friction dans le workflow :

un script dédié à la génération et à l’édition
des options explicites pour --ratio et --size
une configuration API basée sur l’environnement
la prise en charge de génération par lot dans scripts/batch_generate.py
un fichier de référence de prompts avec des motifs de style concrets dans references/prompts.md

Résultat : l’usage de nanobanana est plus cohérent que le fait de retaper à chaque fois des prompts improvisés dans un outil de chat généraliste.

Ce qu’il faut vérifier avant d’adopter nanobanana

Les questions clés avant adoption sont simples :

Il vous faut une GEMINI_API_KEY.
Il vous faut Python 3.10+.
Il vous faut google-genai et pillow.
Vous devez être à l’aise avec l’exécution de scripts en local.
Il faut vous attendre à ce que la qualité d’image dépende fortement de la précision du prompt.

C’est une compétence pratique, pas une application web sans configuration.

Comment utiliser la compétence nanobanana

Conditions requises pour installer nanobanana

Avant de tenter une installation de nanobanana, vérifiez que vous disposez de :

Python 3.10+
une GEMINI_API_KEY valide
un accès réseau à l’API de Google
les paquets Python google-genai et pillow

Installez les dépendances :

pip install google-genai pillow

Définissez votre clé API :

export GEMINI_API_KEY="your_api_key_here"

Vous pouvez obtenir une clé sur https://aistudio.google.com/apikey.

Installer la compétence dans votre environnement skills

Si vous utilisez le système de skills, ajoutez la compétence avec :

npx skills add ReScienceLab/opc-skills --skill nanobanana

Après l’installation, commencez par lire ces fichiers :

skills/nanobanana/SKILL.md
skills/nanobanana/scripts/generate.py
skills/nanobanana/references/prompts.md
skills/nanobanana/scripts/batch_generate.py

Cet ordre de lecture est le plus rapide pour passer de « Est-ce que je peux m’en servir ? » à « Quelles commandes exactes dois-je lancer ? ».

Utilisation de base de nanobanana pour le text-to-image

La commande centrale est le script de génération avec un prompt :

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

Utilisez-la lorsque vous partez uniquement d’un texte. Le chemin de sortie est facultatif, mais le préciser évite d’avoir à retrouver plus tard des fichiers nommés automatiquement.

Modifier une image existante avec nanobanana

Pour l’édition d’image, fournissez à la fois un prompt et une image d’entrée :

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

C’est le bon workflow si vous voulez conserver une image de base tout en demandant une modification ciblée. Le prompt doit décrire le changement attendu, sans redécrire toute la scène, sauf si vous cherchez volontairement une variation plus importante.

Choisir le ratio et la taille de sortie

La compétence prend en charge des ratios courants, notamment :
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9

Exemple :

python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png

Pour une résolution plus élevée :

python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png

Choisissez le ratio tôt dans votre workflow. Il modifie la composition, pas seulement le recadrage.

Utiliser la génération par lot quand l’exploration de prompts compte

scripts/batch_generate.py est le fichier le plus utile à examiner après le script principal, car il permet plusieurs générations à partir d’un même prompt.

Exemple :

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

La génération en parallèle est prise en charge :

python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5

C’est particulièrement utile quand vous explorez un style, plutôt que de chercher une sortie unique et déterministe.

Quel type d’entrée fait bien fonctionner nanobanana

Une intention vague comme « make a cool image » est généralement trop faible. De meilleurs inputs incluent :

un sujet clair
le style visuel visé
des indications de lumière ou de prise de vue
des indices de composition
une intention de qualité ou de rendu

Meilleur prompt :

Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background

Prompt plus faible :

headphones advertisement

La version plus précise donne davantage de signaux de contrôle au modèle et réduit les sorties génériques.

Transformer une idée floue en prompt complet

Un guide nanobanana pratique pour construire un prompt consiste à :

nommer le sujet
préciser le mode visuel
ajouter des détails de scène ou de composition
ajouter la lumière ou l’ambiance
n’ajouter des marqueurs de qualité que s’ils sont réellement utiles

Modèle issu de la référence de prompts du dépôt :

Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere

Exemple :

Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life

Fichiers du dépôt à lire avant un usage sérieux de nanobanana

Si vous voulez aller au-delà d’un usage de nanobanana superficiel, consultez :

SKILL.md pour les prérequis et les schémas de commande
references/prompts.md pour les structures de prompts et les exemples par catégorie
scripts/generate.py pour les types de fichiers pris en charge, les ratios valides et les tailles disponibles
scripts/batch_generate.py pour la concurrence, les délais et le comportement de nommage
.claude-plugin/plugin.json pour le contexte de packaging

C’est bien plus utile que de parcourir rapidement la racine du dépôt, car l’essentiel de la compétence se concentre dans quelques fichiers.

Contraintes pratiques et compromis

Voici les limites importantes qui ressortent des scripts :

l’édition d’image d’entrée dépend de la disponibilité du fichier en local
un fichier image manquant ou non pris en charge fera échouer le processus avant la génération
les ratios et tailles sont limités à un ensemble de valeurs valides connues
le workflow repose sur le modèle d’image preview de Google, donc le comportement peut évoluer avec les mises à jour du modèle
la génération par lot augmente le débit, mais aussi l’usage de l’API et le risque de pression sur les limites de taux

Si vous avez besoin de contrôles avancés sur le pipeline d’image, d’édition nodale ou d’une interface hébergée complète, cette compétence est volontairement plus resserrée.

FAQ sur la compétence nanobanana

nanobanana est-il adapté aux débutants ?

Oui, si vous êtes à l’aise avec les commandes de terminal de base et l’installation de paquets Python. La compétence nanobanana est plus simple que de développer votre propre client API de zéro, mais cela reste un outil orienté développeur plutôt qu’une application grand public.

Quand utiliser nanobanana plutôt qu’un prompt de chat classique ?

Utilisez nanobanana si vous avez besoin de :

fichiers de sortie enregistrés
commandes reproductibles
édition d’images à partir de fichiers locaux
génération par lot
choix explicite du ratio et de la taille

Un prompt dans un chat classique suffit pour des essais occasionnels, mais cette compétence est mieux adaptée quand la gestion des sorties et la reproductibilité comptent.

nanobanana prend-il en charge à la fois la génération et l’édition ?

Oui. Il prend en charge :

la génération text-to-image à partir d’un prompt
l’édition d’image avec -i / --input
le contrôle du ratio
les sorties 2K et 4K
la génération par lot via un script séparé

C’est cette combinaison qui justifie principalement son installation plutôt que l’écriture d’un prompt ponctuel.

nanobanana pour la génération d’images suffit-il pour un usage de production ?

Il peut être utile dans des workflows proches de la production, comme la génération de concepts, l’idéation d’assets, l’exploration de prompts ou des essais de création par lot. En revanche, il ne constitue pas à lui seul un pipeline produit complet. Il vous faut toujours vos propres étapes de revue, de sélection, de stockage et éventuellement de post-traitement.

Dans quels cas nanobanana est-il un mauvais choix ?

Évitez l’installation de nanobanana si vous avez besoin de :

une expérience no-code pensée d’abord pour le navigateur
un workflow GUI entièrement géré
une orchestration complexe d’éditions en plusieurs étapes
de fortes garanties sur la stabilité du comportement du modèle dans le temps
génération d’images sans dépendance à une API externe

Il donne le meilleur de lui-même comme couche de script légère et pragmatique.

Comment améliorer la compétence nanobanana

Commencer par rendre les prompts plus spécifiques

La manière la plus rapide d’améliorer les résultats de nanobanana est de rendre les prompts plus concrets. Ajoutez le sujet, le style, la composition et la lumière au lieu de vous reposer sur des adjectifs comme « cool » ou « beautiful ».

Faible :

a nice city

Plus solide :

Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition

Adapter le style du prompt au type de sortie

Employez un langage de prompt différent selon l’objectif :

pixel art : mentionnez palette limitée, pixels nets, ambiance jeu rétro
photoréaliste : mentionnez l’objectif, la lumière, la mise au point, le réalisme des matériaux
illustration : mentionnez le style artistique, la palette, l’atmosphère, le rendu ou le type de pinceau

C’est l’une des idées les plus concrètes de references/prompts.md.

Mieux éditer une image en ne décrivant que le changement visé

Pour les workflows d’édition, beaucoup d’utilisateurs surchargent leurs prompts. Si vous fournissez déjà une image d’entrée, commencez par la modification précise :

Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent

C’est généralement préférable à la réécriture complète de l’image depuis zéro, sauf si vous voulez réellement une réinterprétation plus large.

Utiliser la génération par lot pour explorer, puis resserrer

Un bon workflow itératif pour l’usage de nanobanana consiste à :

générer 6 à 20 variations autour d’un même thème de prompt
repérer ce qui fonctionne dans les meilleures sorties
réécrire le prompt autour de ces caractéristiques gagnantes
relancer avec une description de style plus resserrée ou un autre ratio

Cette approche est plus efficace que de peaufiner indéfiniment un prompt abstrait avant d’avoir vu la moindre sortie.

Échecs fréquents à surveiller

Les problèmes de qualité les plus courants incluent :

des prompts trop vagues
un ratio mal adapté au sujet
des prompts surchargés avec des styles contradictoires
des prompts d’édition qui demandent involontairement une réécriture complète de la scène
l’idée que le 4K, à lui seul, corrigera un concept faible

La plupart des mauvais résultats viennent de la qualité des instructions, pas de l’absence de mots-clés magiques.

Utiliser le ratio comme levier créatif, pas comme détail de fin

Pour de meilleurs résultats avec nanobanana pour la génération d’images :

utilisez 1:1 pour les icônes, avatars et crops produit
utilisez 9:16 pour des scènes verticales pensées mobile
utilisez 16:9 ou 21:9 pour des paysages cinématographiques
utilisez 4:5 pour des compositions type affiche

Choisir le mauvais ratio produit souvent un cadrage trop serré ou, au contraire, de l’espace perdu.

Gagner en confiance en testant directement les scripts

Si la compétence vous paraît floue, exécutez les scripts vous-même avant de la juger. scripts/generate.py et scripts/batch_generate.py sont assez courts pour être inspectés rapidement, ce qui vous permet de vérifier les options prises en charge, les chemins d’échec et le comportement de nommage. Pour ce dépôt, l’inspection directe des scripts apporte plus de confiance qu’une simple lecture de la description générale.

Meilleure amélioration à apporter si la première sortie est proche, mais pas correcte

Ne repartez pas de zéro. Changez une seule variable à la fois :

détail du sujet
formulation du style
indication de lumière
ratio
portée de l’instruction d’édition

C’est le moyen le plus simple de comprendre à quoi le modèle réagit et d’améliorer rapidement votre intuition pour le guide nanobanana.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

openclaw-persona-forge

par affaan-m

openclaw-persona-forge est un skill orienté workflow pour créer de A à Z des packs de persona OpenClaw complets. Il génère la tension identitaire, un cadrage de type SOUL.md, des règles de limites, des options de nom et, en option, des consignes pour le prompt d’avatar. Idéal pour la conception de personnages OpenClaw, les agents de roleplay et les personas proches du design d’interface, mais pas pour de simples retouches d’un persona existant.

UI Design

Favoris 0GitHub 156.2k

baoyu-imagine

par JimLiu

baoyu-imagine est une skill de génération d’images multi-fournisseurs avec une CLI typée, une configuration `EXTEND.md` obligatoire, la prise en charge d’images de référence, des réglages de ratio d’aspect et des exécutions par lots via OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream et Replicate.

Image Generation

Favoris 0GitHub 13.2k

baoyu-comic

par JimLiu

baoyu-comic est une skill conçue pour transformer un texte source en BD éducatives ou biographiques, avec planification du storyboard, cohérence des personnages, mise en page des cases et génération d’images par étapes. Elle prend en charge une utilisation en CLI installable, des options de style et de mise en page, ainsi que des workflows partiels comme `--storyboard-only`, `--prompts-only` et `--regenerate` pour piloter la production de comics de façon contrôlée.

Image Generation

Favoris 0GitHub 13.2k

shader-dev

par MiniMax-AI

shader-dev est un skill GLSL pratique pour des visuels temps réel à la ShaderToy. Utilisez le skill shader-dev pour créer ou déboguer du ray marching, des scènes SDF, l’éclairage, des particules, le mouvement fluide, le post-traitement et le shader-dev pour la conception d’interface, avec moins d’approximation qu’avec un prompt générique.

UI Design

Favoris 0GitHub 11.7k

videoagent-video-studio

par pexoai

videoagent-video-studio est une skill de génération de courtes vidéos IA à partir de texte, d’images et de références. Utilisez-la pour tester des workflows text-to-video et image-to-video, comparer les modèles pris en charge, et exécuter la configuration via proxy hébergé ou en auto-hébergement avec Node 18+.

Video Editing

Favoris 0GitHub 456

seo-image-gen

par AgriciDaniel

seo-image-gen est un skill GitHub qui transforme les demandes d’images SEO en prompts et réglages prêts pour la production, pour les images OG, aperçus sociaux, bannières héro, visuels produit, infographies et vignettes. Il utilise Gemini via nanobanana-mcp et suppose que l’extension banana est installée, afin de proposer un guide et un workflow seo-image-gen concrets et opérationnels.

Image Generation

Favoris 0GitHub 0

baoyu-xhs-images

par JimLiu

baoyu-xhs-images transforme des articles ou des notes en carrousels infographiques Xiaohongshu grâce à des préréglages, des styles, des mises en page et des conseils de configuration. Cette skill aide à l’installer, à choisir les bonnes entrées et à exécuter `/baoyu-xhs-images` pour produire des posts sociaux structurés en plusieurs slides.

UI Design

Favoris 0GitHub 13.2k

baoyu-cover-image

par JimLiu

baoyu-cover-image aide les agents à générer des prompts structurés pour des images de couverture d’article à partir du type, de la palette, du rendu, du texte et de l’ambiance. Il prend en charge les formats 2.35:1, 16:9 et 1:1, inclut des règles de sélection automatique et des conseils de compatibilité, et convient aux workflows éditoriaux reproductibles ainsi qu’à la conception de couvertures en UI Design.

UI Design

Favoris 0GitHub 13.2k

meme-factory

par softaworks

meme-factory aide les agents à créer des mèmes à partir de templates via l’API gratuite `memegen.link`, ainsi que des mèmes textuels compatibles Markdown. Utilisez-la pour générer des URL de mèmes prêtes à partager, choisir le bon template, formater correctement le texte et automatiser la production grâce au helper Python inclus.

Image Generation

Favoris 0GitHub 1.3k

logo-creator

par ReScienceLab

logo-creator est un workflow IA dédié à la création de logos : génération de concepts, comparaison de variantes, recadrage, suppression d’arrière-plan et export d’assets SVG. Il s’appuie sur des références de style, des prompts d’exemple et des scripts utilitaires pour créer logos, icônes, favicons et brand marks dans ReScienceLab/opc-skills.

Branding

Favoris 0GitHub 0

scientific-schematics

par K-Dense-AI

scientific-schematics transforme des requêtes en langage naturel en schémas scientifiques prêts à publier, avec un affinement itératif intelligent. Le skill s’appuie sur Nano Banana 2 pour la génération et Gemini 3.1 Pro Preview pour la relecture, puis ne régénère que si le résultat passe sous le seuil adapté à votre type de document. Il est conçu pour les architectures de réseaux de neurones, les schémas système, les organigrammes, les voies biologiques et d’autres visuels scientifiques complexes.

Image Generation

Favoris 0GitHub 0

banner-creator

par ReScienceLab

banner-creator aide à créer des bannières, en-têtes et hero images grâce à un workflow structuré : recueil des besoins, génération de variantes, affinage avec les retours, puis recadrage aux bons ratios selon la plateforme via le script inclus.

UI Design

Favoris 0GitHub 0

baoyu-article-illustrator

par JimLiu

baoyu-article-illustrator aide les agents à transformer des brouillons d’articles en prompts d’illustration structurés, en placements d’images et en choix cohérents de type et de style pour des contenus explicatifs, des tutoriels, des schémas et des articles à images multiples.

Image Generation

Favoris 0GitHub 13.2k

sound-fx

par NoizAI

Utilisez le skill sound-fx pour transformer des prompts textuels en effets sonores, bruitages, nappes d’ambiance, sons de créatures et bruits d’interface. Il convient au montage audio, au prototypage rapide et à la création d’assets audio téléchargeables. Installez-le avec NoizAI/skills, puis utilisez le workflow basé sur un script avec une clé Noiz API valide. Ne convient pas à la parole, aux paroles, à la mélodie ni au clonage de voix.

Audio Editing

Favoris 0GitHub 498

chat-with-anyone

par NoizAI

chat-with-anyone permet de cloner la voix d’une personne réelle à partir d’audios publics ou de créer une voix assortie à partir d’une image, puis de générer des réponses synthétiques avec la TTS. Il prend en charge des usages concrets pour le roleplay, la narration et la génération vocale, avec des নির্দেশրctions sur l’installation, le choix des sources et une utilisation sûre.

Voice Generation

Favoris 0GitHub 498

videoagent-image-studio

par pexoai

videoagent-image-studio est un skill unifié de génération d’images pour les agents basés sur Node. Il propose un flux CLI unique pour Midjourney, Flux, Ideogram, Recraft, SDXL et d’autres modèles, avec configuration via proxy, aide au choix du modèle et sorties normalisées pour l’automatisation.

Image Generation

Favoris 0GitHub 456