nanobanana
par ReScienceLabnanobanana est une skill CLI Python pour Google Gemini 3 Pro Image, avec génération texte-vers-image, retouche d’images, gestion des ratios, sortie 2K/4K et génération par lots via de simples scripts locaux.
Cette skill obtient 78/100, ce qui en fait une fiche solide pour l’annuaire : les agents disposent d’un déclencheur clair, de commandes concrètes et de scripts exécutables pour la génération et la retouche d’images avec Gemini, même si les utilisateurs doivent encore gérer eux-mêmes la configuration et une part d’incertitude liée au modèle.
- Excellente capacité de déclenchement : le frontmatter indique explicitement de l’utiliser pour générer ou retoucher des images avec la génération d’images Gemini.
- Concrète sur le plan opérationnel : `SKILL.md` inclut les prérequis, les commandes d’installation `pip`, des exemples de démarrage rapide, l’usage en CLI et les options de sortie et de retouche.
- Un vrai levier de workflow au-delà du simple prompting : les scripts inclus `generate.py` et `batch_generate.py` prennent en charge le texte-vers-image, la retouche d’images, les ratios, la sortie 2K/4K et la génération par lots.
- L’adoption demande une configuration externe : les utilisateurs doivent fournir `GEMINI_API_KEY` et installer Python 3.10+, `google-genai` et Pillow.
- Certaines limites de confiance et de clarté subsistent, car la skill repose sur un modèle en preview (`gemini-3-pro-image-preview`) et les éléments fournis ne montrent ni dépannage, ni guide sur les modes d’erreur, ni automatisation de l’installation dans `SKILL.md`.
Vue d’ensemble de la compétence nanobanana
À quoi sert nanobanana
La compétence nanobanana est une surcouche légère du modèle gemini-3-pro-image-preview de Google, pensée pour la génération et l’édition d’images en pratique depuis la ligne de commande. Elle convient particulièrement à celles et ceux qui veulent une méthode reproductible et scriptable pour créer des images, tester des variantes de prompts ou générer des lots de sorties sans devoir construire une application complète au préalable.
À qui s’adresse l’installation de nanobanana
La compétence nanobanana est particulièrement adaptée :
- aux développeurs qui utilisent déjà Python et les variables d’environnement
- aux opérateurs IA qui veulent des commandes de génération d’images reproductibles
- aux personnes qui testent des prompts et comparent styles, ratios et tailles de sortie
- aux utilisateurs qui ont besoin à la fois de workflows text-to-image et de modification d’image existante
Si vous cherchez seulement à générer ponctuellement quelques images dans une interface de chat, la mise en place risque d’être plus lourde que nécessaire.
Le besoin concret auquel répond nanobanana
La plupart des utilisateurs ne cherchent pas « un modèle d’image » de manière abstraite. Ils veulent transformer une intention créative encore floue en ressource exploitable : photo produit, paysage, mascotte, illustration conceptuelle ou version retouchée d’une image existante. nanobanana pour la génération d’images est utile précisément parce qu’il offre un chemin direct en CLI pour ce besoin, avec saisie du prompt, image source en option, choix du ratio et sorties en 2K/4K.
Ce qui différencie nanobanana d’un prompt générique
Le vrai différenciateur n’est pas un prompting secret. C’est la réduction de friction dans le workflow :
- un script dédié à la génération et à l’édition
- des options explicites pour
--ratioet--size - une configuration API basée sur l’environnement
- la prise en charge de génération par lot dans
scripts/batch_generate.py - un fichier de référence de prompts avec des motifs de style concrets dans
references/prompts.md
Résultat : l’usage de nanobanana est plus cohérent que le fait de retaper à chaque fois des prompts improvisés dans un outil de chat généraliste.
Ce qu’il faut vérifier avant d’adopter nanobanana
Les questions clés avant adoption sont simples :
- Il vous faut une
GEMINI_API_KEY. - Il vous faut Python
3.10+. - Il vous faut
google-genaietpillow. - Vous devez être à l’aise avec l’exécution de scripts en local.
- Il faut vous attendre à ce que la qualité d’image dépende fortement de la précision du prompt.
C’est une compétence pratique, pas une application web sans configuration.
Comment utiliser la compétence nanobanana
Conditions requises pour installer nanobanana
Avant de tenter une installation de nanobanana, vérifiez que vous disposez de :
- Python
3.10+ - une
GEMINI_API_KEYvalide - un accès réseau à l’API de Google
- les paquets Python
google-genaietpillow
Installez les dépendances :
pip install google-genai pillow
Définissez votre clé API :
export GEMINI_API_KEY="your_api_key_here"
Vous pouvez obtenir une clé sur https://aistudio.google.com/apikey.
Installer la compétence dans votre environnement skills
Si vous utilisez le système de skills, ajoutez la compétence avec :
npx skills add ReScienceLab/opc-skills --skill nanobanana
Après l’installation, commencez par lire ces fichiers :
skills/nanobanana/SKILL.mdskills/nanobanana/scripts/generate.pyskills/nanobanana/references/prompts.mdskills/nanobanana/scripts/batch_generate.py
Cet ordre de lecture est le plus rapide pour passer de « Est-ce que je peux m’en servir ? » à « Quelles commandes exactes dois-je lancer ? ».
Utilisation de base de nanobanana pour le text-to-image
La commande centrale est le script de génération avec un prompt :
python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png
Utilisez-la lorsque vous partez uniquement d’un texte. Le chemin de sortie est facultatif, mais le préciser évite d’avoir à retrouver plus tard des fichiers nommés automatiquement.
Modifier une image existante avec nanobanana
Pour l’édition d’image, fournissez à la fois un prompt et une image d’entrée :
python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png
C’est le bon workflow si vous voulez conserver une image de base tout en demandant une modification ciblée. Le prompt doit décrire le changement attendu, sans redécrire toute la scène, sauf si vous cherchez volontairement une variation plus importante.
Choisir le ratio et la taille de sortie
La compétence prend en charge des ratios courants, notamment :
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Exemple :
python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png
Pour une résolution plus élevée :
python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png
Choisissez le ratio tôt dans votre workflow. Il modifie la composition, pas seulement le recadrage.
Utiliser la génération par lot quand l’exploration de prompts compte
scripts/batch_generate.py est le fichier le plus utile à examiner après le script principal, car il permet plusieurs générations à partir d’un même prompt.
Exemple :
python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo
La génération en parallèle est prise en charge :
python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5
C’est particulièrement utile quand vous explorez un style, plutôt que de chercher une sortie unique et déterministe.
Quel type d’entrée fait bien fonctionner nanobanana
Une intention vague comme « make a cool image » est généralement trop faible. De meilleurs inputs incluent :
- un sujet clair
- le style visuel visé
- des indications de lumière ou de prise de vue
- des indices de composition
- une intention de qualité ou de rendu
Meilleur prompt :
Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background
Prompt plus faible :
headphones advertisement
La version plus précise donne davantage de signaux de contrôle au modèle et réduit les sorties génériques.
Transformer une idée floue en prompt complet
Un guide nanobanana pratique pour construire un prompt consiste à :
- nommer le sujet
- préciser le mode visuel
- ajouter des détails de scène ou de composition
- ajouter la lumière ou l’ambiance
- n’ajouter des marqueurs de qualité que s’ils sont réellement utiles
Modèle issu de la référence de prompts du dépôt :
Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere
Exemple :
Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life
Fichiers du dépôt à lire avant un usage sérieux de nanobanana
Si vous voulez aller au-delà d’un usage de nanobanana superficiel, consultez :
SKILL.mdpour les prérequis et les schémas de commandereferences/prompts.mdpour les structures de prompts et les exemples par catégoriescripts/generate.pypour les types de fichiers pris en charge, les ratios valides et les tailles disponiblesscripts/batch_generate.pypour la concurrence, les délais et le comportement de nommage.claude-plugin/plugin.jsonpour le contexte de packaging
C’est bien plus utile que de parcourir rapidement la racine du dépôt, car l’essentiel de la compétence se concentre dans quelques fichiers.
Contraintes pratiques et compromis
Voici les limites importantes qui ressortent des scripts :
- l’édition d’image d’entrée dépend de la disponibilité du fichier en local
- un fichier image manquant ou non pris en charge fera échouer le processus avant la génération
- les ratios et tailles sont limités à un ensemble de valeurs valides connues
- le workflow repose sur le modèle d’image preview de Google, donc le comportement peut évoluer avec les mises à jour du modèle
- la génération par lot augmente le débit, mais aussi l’usage de l’API et le risque de pression sur les limites de taux
Si vous avez besoin de contrôles avancés sur le pipeline d’image, d’édition nodale ou d’une interface hébergée complète, cette compétence est volontairement plus resserrée.
FAQ sur la compétence nanobanana
nanobanana est-il adapté aux débutants ?
Oui, si vous êtes à l’aise avec les commandes de terminal de base et l’installation de paquets Python. La compétence nanobanana est plus simple que de développer votre propre client API de zéro, mais cela reste un outil orienté développeur plutôt qu’une application grand public.
Quand utiliser nanobanana plutôt qu’un prompt de chat classique ?
Utilisez nanobanana si vous avez besoin de :
- fichiers de sortie enregistrés
- commandes reproductibles
- édition d’images à partir de fichiers locaux
- génération par lot
- choix explicite du ratio et de la taille
Un prompt dans un chat classique suffit pour des essais occasionnels, mais cette compétence est mieux adaptée quand la gestion des sorties et la reproductibilité comptent.
nanobanana prend-il en charge à la fois la génération et l’édition ?
Oui. Il prend en charge :
- la génération text-to-image à partir d’un prompt
- l’édition d’image avec
-i/--input - le contrôle du ratio
- les sorties
2Ket4K - la génération par lot via un script séparé
C’est cette combinaison qui justifie principalement son installation plutôt que l’écriture d’un prompt ponctuel.
nanobanana pour la génération d’images suffit-il pour un usage de production ?
Il peut être utile dans des workflows proches de la production, comme la génération de concepts, l’idéation d’assets, l’exploration de prompts ou des essais de création par lot. En revanche, il ne constitue pas à lui seul un pipeline produit complet. Il vous faut toujours vos propres étapes de revue, de sélection, de stockage et éventuellement de post-traitement.
Dans quels cas nanobanana est-il un mauvais choix ?
Évitez l’installation de nanobanana si vous avez besoin de :
- une expérience no-code pensée d’abord pour le navigateur
- un workflow GUI entièrement géré
- une orchestration complexe d’éditions en plusieurs étapes
- de fortes garanties sur la stabilité du comportement du modèle dans le temps
- génération d’images sans dépendance à une API externe
Il donne le meilleur de lui-même comme couche de script légère et pragmatique.
Comment améliorer la compétence nanobanana
Commencer par rendre les prompts plus spécifiques
La manière la plus rapide d’améliorer les résultats de nanobanana est de rendre les prompts plus concrets. Ajoutez le sujet, le style, la composition et la lumière au lieu de vous reposer sur des adjectifs comme « cool » ou « beautiful ».
Faible :
a nice city
Plus solide :
Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition
Adapter le style du prompt au type de sortie
Employez un langage de prompt différent selon l’objectif :
- pixel art : mentionnez palette limitée, pixels nets, ambiance jeu rétro
- photoréaliste : mentionnez l’objectif, la lumière, la mise au point, le réalisme des matériaux
- illustration : mentionnez le style artistique, la palette, l’atmosphère, le rendu ou le type de pinceau
C’est l’une des idées les plus concrètes de references/prompts.md.
Mieux éditer une image en ne décrivant que le changement visé
Pour les workflows d’édition, beaucoup d’utilisateurs surchargent leurs prompts. Si vous fournissez déjà une image d’entrée, commencez par la modification précise :
Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent
C’est généralement préférable à la réécriture complète de l’image depuis zéro, sauf si vous voulez réellement une réinterprétation plus large.
Utiliser la génération par lot pour explorer, puis resserrer
Un bon workflow itératif pour l’usage de nanobanana consiste à :
- générer 6 à 20 variations autour d’un même thème de prompt
- repérer ce qui fonctionne dans les meilleures sorties
- réécrire le prompt autour de ces caractéristiques gagnantes
- relancer avec une description de style plus resserrée ou un autre ratio
Cette approche est plus efficace que de peaufiner indéfiniment un prompt abstrait avant d’avoir vu la moindre sortie.
Échecs fréquents à surveiller
Les problèmes de qualité les plus courants incluent :
- des prompts trop vagues
- un ratio mal adapté au sujet
- des prompts surchargés avec des styles contradictoires
- des prompts d’édition qui demandent involontairement une réécriture complète de la scène
- l’idée que le 4K, à lui seul, corrigera un concept faible
La plupart des mauvais résultats viennent de la qualité des instructions, pas de l’absence de mots-clés magiques.
Utiliser le ratio comme levier créatif, pas comme détail de fin
Pour de meilleurs résultats avec nanobanana pour la génération d’images :
- utilisez
1:1pour les icônes, avatars et crops produit - utilisez
9:16pour des scènes verticales pensées mobile - utilisez
16:9ou21:9pour des paysages cinématographiques - utilisez
4:5pour des compositions type affiche
Choisir le mauvais ratio produit souvent un cadrage trop serré ou, au contraire, de l’espace perdu.
Gagner en confiance en testant directement les scripts
Si la compétence vous paraît floue, exécutez les scripts vous-même avant de la juger. scripts/generate.py et scripts/batch_generate.py sont assez courts pour être inspectés rapidement, ce qui vous permet de vérifier les options prises en charge, les chemins d’échec et le comportement de nommage. Pour ce dépôt, l’inspection directe des scripts apporte plus de confiance qu’une simple lecture de la description générale.
Meilleure amélioration à apporter si la première sortie est proche, mais pas correcte
Ne repartez pas de zéro. Changez une seule variable à la fois :
- détail du sujet
- formulation du style
- indication de lumière
- ratio
- portée de l’instruction d’édition
C’est le moyen le plus simple de comprendre à quoi le modèle réagit et d’améliorer rapidement votre intuition pour le guide nanobanana.
