R

nanobanana est une skill CLI Python pour Google Gemini 3 Pro Image, avec génération texte-vers-image, retouche d’images, gestion des ratios, sortie 2K/4K et génération par lots via de simples scripts locaux.

Étoiles654
Favoris0
Commentaires0
Ajouté31 mars 2026
CatégorieImage Generation
Commande d’installation
npx skills add ReScienceLab/opc-skills --skill nanobanana
Score éditorial

Cette skill obtient 78/100, ce qui en fait une fiche solide pour l’annuaire : les agents disposent d’un déclencheur clair, de commandes concrètes et de scripts exécutables pour la génération et la retouche d’images avec Gemini, même si les utilisateurs doivent encore gérer eux-mêmes la configuration et une part d’incertitude liée au modèle.

78/100
Points forts
  • Excellente capacité de déclenchement : le frontmatter indique explicitement de l’utiliser pour générer ou retoucher des images avec la génération d’images Gemini.
  • Concrète sur le plan opérationnel : `SKILL.md` inclut les prérequis, les commandes d’installation `pip`, des exemples de démarrage rapide, l’usage en CLI et les options de sortie et de retouche.
  • Un vrai levier de workflow au-delà du simple prompting : les scripts inclus `generate.py` et `batch_generate.py` prennent en charge le texte-vers-image, la retouche d’images, les ratios, la sortie 2K/4K et la génération par lots.
Points de vigilance
  • L’adoption demande une configuration externe : les utilisateurs doivent fournir `GEMINI_API_KEY` et installer Python 3.10+, `google-genai` et Pillow.
  • Certaines limites de confiance et de clarté subsistent, car la skill repose sur un modèle en preview (`gemini-3-pro-image-preview`) et les éléments fournis ne montrent ni dépannage, ni guide sur les modes d’erreur, ni automatisation de l’installation dans `SKILL.md`.
Vue d’ensemble

Vue d’ensemble de la compétence nanobanana

À quoi sert nanobanana

La compétence nanobanana est une surcouche légère du modèle gemini-3-pro-image-preview de Google, pensée pour la génération et l’édition d’images en pratique depuis la ligne de commande. Elle convient particulièrement à celles et ceux qui veulent une méthode reproductible et scriptable pour créer des images, tester des variantes de prompts ou générer des lots de sorties sans devoir construire une application complète au préalable.

À qui s’adresse l’installation de nanobanana

La compétence nanobanana est particulièrement adaptée :

  • aux développeurs qui utilisent déjà Python et les variables d’environnement
  • aux opérateurs IA qui veulent des commandes de génération d’images reproductibles
  • aux personnes qui testent des prompts et comparent styles, ratios et tailles de sortie
  • aux utilisateurs qui ont besoin à la fois de workflows text-to-image et de modification d’image existante

Si vous cherchez seulement à générer ponctuellement quelques images dans une interface de chat, la mise en place risque d’être plus lourde que nécessaire.

Le besoin concret auquel répond nanobanana

La plupart des utilisateurs ne cherchent pas « un modèle d’image » de manière abstraite. Ils veulent transformer une intention créative encore floue en ressource exploitable : photo produit, paysage, mascotte, illustration conceptuelle ou version retouchée d’une image existante. nanobanana pour la génération d’images est utile précisément parce qu’il offre un chemin direct en CLI pour ce besoin, avec saisie du prompt, image source en option, choix du ratio et sorties en 2K/4K.

Ce qui différencie nanobanana d’un prompt générique

Le vrai différenciateur n’est pas un prompting secret. C’est la réduction de friction dans le workflow :

  • un script dédié à la génération et à l’édition
  • des options explicites pour --ratio et --size
  • une configuration API basée sur l’environnement
  • la prise en charge de génération par lot dans scripts/batch_generate.py
  • un fichier de référence de prompts avec des motifs de style concrets dans references/prompts.md

Résultat : l’usage de nanobanana est plus cohérent que le fait de retaper à chaque fois des prompts improvisés dans un outil de chat généraliste.

Ce qu’il faut vérifier avant d’adopter nanobanana

Les questions clés avant adoption sont simples :

  • Il vous faut une GEMINI_API_KEY.
  • Il vous faut Python 3.10+.
  • Il vous faut google-genai et pillow.
  • Vous devez être à l’aise avec l’exécution de scripts en local.
  • Il faut vous attendre à ce que la qualité d’image dépende fortement de la précision du prompt.

C’est une compétence pratique, pas une application web sans configuration.

Comment utiliser la compétence nanobanana

Conditions requises pour installer nanobanana

Avant de tenter une installation de nanobanana, vérifiez que vous disposez de :

  • Python 3.10+
  • une GEMINI_API_KEY valide
  • un accès réseau à l’API de Google
  • les paquets Python google-genai et pillow

Installez les dépendances :

pip install google-genai pillow

Définissez votre clé API :

export GEMINI_API_KEY="your_api_key_here"

Vous pouvez obtenir une clé sur https://aistudio.google.com/apikey.

Installer la compétence dans votre environnement skills

Si vous utilisez le système de skills, ajoutez la compétence avec :

npx skills add ReScienceLab/opc-skills --skill nanobanana

Après l’installation, commencez par lire ces fichiers :

  • skills/nanobanana/SKILL.md
  • skills/nanobanana/scripts/generate.py
  • skills/nanobanana/references/prompts.md
  • skills/nanobanana/scripts/batch_generate.py

Cet ordre de lecture est le plus rapide pour passer de « Est-ce que je peux m’en servir ? » à « Quelles commandes exactes dois-je lancer ? ».

Utilisation de base de nanobanana pour le text-to-image

La commande centrale est le script de génération avec un prompt :

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

Utilisez-la lorsque vous partez uniquement d’un texte. Le chemin de sortie est facultatif, mais le préciser évite d’avoir à retrouver plus tard des fichiers nommés automatiquement.

Modifier une image existante avec nanobanana

Pour l’édition d’image, fournissez à la fois un prompt et une image d’entrée :

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

C’est le bon workflow si vous voulez conserver une image de base tout en demandant une modification ciblée. Le prompt doit décrire le changement attendu, sans redécrire toute la scène, sauf si vous cherchez volontairement une variation plus importante.

Choisir le ratio et la taille de sortie

La compétence prend en charge des ratios courants, notamment :
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9

Exemple :

python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png

Pour une résolution plus élevée :

python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png

Choisissez le ratio tôt dans votre workflow. Il modifie la composition, pas seulement le recadrage.

Utiliser la génération par lot quand l’exploration de prompts compte

scripts/batch_generate.py est le fichier le plus utile à examiner après le script principal, car il permet plusieurs générations à partir d’un même prompt.

Exemple :

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

La génération en parallèle est prise en charge :

python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5

C’est particulièrement utile quand vous explorez un style, plutôt que de chercher une sortie unique et déterministe.

Quel type d’entrée fait bien fonctionner nanobanana

Une intention vague comme « make a cool image » est généralement trop faible. De meilleurs inputs incluent :

  • un sujet clair
  • le style visuel visé
  • des indications de lumière ou de prise de vue
  • des indices de composition
  • une intention de qualité ou de rendu

Meilleur prompt :

Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background

Prompt plus faible :

headphones advertisement

La version plus précise donne davantage de signaux de contrôle au modèle et réduit les sorties génériques.

Transformer une idée floue en prompt complet

Un guide nanobanana pratique pour construire un prompt consiste à :

  1. nommer le sujet
  2. préciser le mode visuel
  3. ajouter des détails de scène ou de composition
  4. ajouter la lumière ou l’ambiance
  5. n’ajouter des marqueurs de qualité que s’ils sont réellement utiles

Modèle issu de la référence de prompts du dépôt :

Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere

Exemple :

Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life

Fichiers du dépôt à lire avant un usage sérieux de nanobanana

Si vous voulez aller au-delà d’un usage de nanobanana superficiel, consultez :

  • SKILL.md pour les prérequis et les schémas de commande
  • references/prompts.md pour les structures de prompts et les exemples par catégorie
  • scripts/generate.py pour les types de fichiers pris en charge, les ratios valides et les tailles disponibles
  • scripts/batch_generate.py pour la concurrence, les délais et le comportement de nommage
  • .claude-plugin/plugin.json pour le contexte de packaging

C’est bien plus utile que de parcourir rapidement la racine du dépôt, car l’essentiel de la compétence se concentre dans quelques fichiers.

Contraintes pratiques et compromis

Voici les limites importantes qui ressortent des scripts :

  • l’édition d’image d’entrée dépend de la disponibilité du fichier en local
  • un fichier image manquant ou non pris en charge fera échouer le processus avant la génération
  • les ratios et tailles sont limités à un ensemble de valeurs valides connues
  • le workflow repose sur le modèle d’image preview de Google, donc le comportement peut évoluer avec les mises à jour du modèle
  • la génération par lot augmente le débit, mais aussi l’usage de l’API et le risque de pression sur les limites de taux

Si vous avez besoin de contrôles avancés sur le pipeline d’image, d’édition nodale ou d’une interface hébergée complète, cette compétence est volontairement plus resserrée.

FAQ sur la compétence nanobanana

nanobanana est-il adapté aux débutants ?

Oui, si vous êtes à l’aise avec les commandes de terminal de base et l’installation de paquets Python. La compétence nanobanana est plus simple que de développer votre propre client API de zéro, mais cela reste un outil orienté développeur plutôt qu’une application grand public.

Quand utiliser nanobanana plutôt qu’un prompt de chat classique ?

Utilisez nanobanana si vous avez besoin de :

  • fichiers de sortie enregistrés
  • commandes reproductibles
  • édition d’images à partir de fichiers locaux
  • génération par lot
  • choix explicite du ratio et de la taille

Un prompt dans un chat classique suffit pour des essais occasionnels, mais cette compétence est mieux adaptée quand la gestion des sorties et la reproductibilité comptent.

nanobanana prend-il en charge à la fois la génération et l’édition ?

Oui. Il prend en charge :

  • la génération text-to-image à partir d’un prompt
  • l’édition d’image avec -i / --input
  • le contrôle du ratio
  • les sorties 2K et 4K
  • la génération par lot via un script séparé

C’est cette combinaison qui justifie principalement son installation plutôt que l’écriture d’un prompt ponctuel.

nanobanana pour la génération d’images suffit-il pour un usage de production ?

Il peut être utile dans des workflows proches de la production, comme la génération de concepts, l’idéation d’assets, l’exploration de prompts ou des essais de création par lot. En revanche, il ne constitue pas à lui seul un pipeline produit complet. Il vous faut toujours vos propres étapes de revue, de sélection, de stockage et éventuellement de post-traitement.

Dans quels cas nanobanana est-il un mauvais choix ?

Évitez l’installation de nanobanana si vous avez besoin de :

  • une expérience no-code pensée d’abord pour le navigateur
  • un workflow GUI entièrement géré
  • une orchestration complexe d’éditions en plusieurs étapes
  • de fortes garanties sur la stabilité du comportement du modèle dans le temps
  • génération d’images sans dépendance à une API externe

Il donne le meilleur de lui-même comme couche de script légère et pragmatique.

Comment améliorer la compétence nanobanana

Commencer par rendre les prompts plus spécifiques

La manière la plus rapide d’améliorer les résultats de nanobanana est de rendre les prompts plus concrets. Ajoutez le sujet, le style, la composition et la lumière au lieu de vous reposer sur des adjectifs comme « cool » ou « beautiful ».

Faible :

a nice city

Plus solide :

Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition

Adapter le style du prompt au type de sortie

Employez un langage de prompt différent selon l’objectif :

  • pixel art : mentionnez palette limitée, pixels nets, ambiance jeu rétro
  • photoréaliste : mentionnez l’objectif, la lumière, la mise au point, le réalisme des matériaux
  • illustration : mentionnez le style artistique, la palette, l’atmosphère, le rendu ou le type de pinceau

C’est l’une des idées les plus concrètes de references/prompts.md.

Mieux éditer une image en ne décrivant que le changement visé

Pour les workflows d’édition, beaucoup d’utilisateurs surchargent leurs prompts. Si vous fournissez déjà une image d’entrée, commencez par la modification précise :

Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent

C’est généralement préférable à la réécriture complète de l’image depuis zéro, sauf si vous voulez réellement une réinterprétation plus large.

Utiliser la génération par lot pour explorer, puis resserrer

Un bon workflow itératif pour l’usage de nanobanana consiste à :

  1. générer 6 à 20 variations autour d’un même thème de prompt
  2. repérer ce qui fonctionne dans les meilleures sorties
  3. réécrire le prompt autour de ces caractéristiques gagnantes
  4. relancer avec une description de style plus resserrée ou un autre ratio

Cette approche est plus efficace que de peaufiner indéfiniment un prompt abstrait avant d’avoir vu la moindre sortie.

Échecs fréquents à surveiller

Les problèmes de qualité les plus courants incluent :

  • des prompts trop vagues
  • un ratio mal adapté au sujet
  • des prompts surchargés avec des styles contradictoires
  • des prompts d’édition qui demandent involontairement une réécriture complète de la scène
  • l’idée que le 4K, à lui seul, corrigera un concept faible

La plupart des mauvais résultats viennent de la qualité des instructions, pas de l’absence de mots-clés magiques.

Utiliser le ratio comme levier créatif, pas comme détail de fin

Pour de meilleurs résultats avec nanobanana pour la génération d’images :

  • utilisez 1:1 pour les icônes, avatars et crops produit
  • utilisez 9:16 pour des scènes verticales pensées mobile
  • utilisez 16:9 ou 21:9 pour des paysages cinématographiques
  • utilisez 4:5 pour des compositions type affiche

Choisir le mauvais ratio produit souvent un cadrage trop serré ou, au contraire, de l’espace perdu.

Gagner en confiance en testant directement les scripts

Si la compétence vous paraît floue, exécutez les scripts vous-même avant de la juger. scripts/generate.py et scripts/batch_generate.py sont assez courts pour être inspectés rapidement, ce qui vous permet de vérifier les options prises en charge, les chemins d’échec et le comportement de nommage. Pour ce dépôt, l’inspection directe des scripts apporte plus de confiance qu’une simple lecture de la description générale.

Meilleure amélioration à apporter si la première sortie est proche, mais pas correcte

Ne repartez pas de zéro. Changez une seule variable à la fois :

  • détail du sujet
  • formulation du style
  • indication de lumière
  • ratio
  • portée de l’instruction d’édition

C’est le moyen le plus simple de comprendre à quoi le modèle réagit et d’améliorer rapidement votre intuition pour le guide nanobanana.

Notes et avis

Aucune note pour le moment
Partagez votre avis
Connectez-vous pour laisser une note et un commentaire sur cet outil.
G
0/10000
Derniers avis
Enregistrement...