R

nanobanana ist eine Python-CLI-Skill für Google Gemini 3 Pro Image und unterstützt Text-zu-Bild, Bildbearbeitung, Seitenverhältnisse, 2K-/4K-Ausgabe sowie Batch-Generierung mit einfachen lokalen Skripten.

Stars654
Favoriten0
Kommentare0
Hinzugefügt31. März 2026
KategorieImage Generation
Installationsbefehl
npx skills add ReScienceLab/opc-skills --skill nanobanana
Kurationswert

Diese Skill erreicht 78/100 und ist damit ein solider Kandidat für das Verzeichnis: Agents erhalten einen klaren Auslöser, konkrete Befehle und direkt nutzbare Skripte für Gemini-basierte Bildgenerierung und -bearbeitung, auch wenn Nutzer Setup und einige modellbedingte Unsicherheiten weiterhin selbst abfangen müssen.

78/100
Stärken
  • Hohe Trigger-Eignung: Im Frontmatter steht ausdrücklich, dass die Skill für das Generieren oder Bearbeiten von Bildern mit Gemini image generation verwendet werden soll.
  • Operativ konkret: `SKILL.md` enthält Voraussetzungen, `pip install`-Befehle, Quickstart-Beispiele, CLI-Nutzung sowie Optionen für Ausgabe und Bearbeitung.
  • Praktischer Workflow-Nutzen über reines Prompting hinaus: Die enthaltenen Skripte `generate.py` und `batch_generate.py` unterstützen Text-zu-Bild, Bildbearbeitung, Seitenverhältnisse, 2K-/4K-Ausgabe und Batch-Generierung.
Hinweise
  • Die Nutzung erfordert externes Setup: Anwender müssen `GEMINI_API_KEY` bereitstellen und Python 3.10+, `google-genai` und Pillow installieren.
  • Es bleiben gewisse Grenzen bei Vertrauen und Klarheit, da die Skill von einem Preview-Modell (`gemini-3-pro-image-preview`) abhängt und die vorliegenden Hinweise weder Troubleshooting noch Anleitungen zu Fehlerszenarien oder Installationsautomatisierung in `SKILL.md` zeigen.
Überblick

Überblick über den nanobanana-Skill

Wofür nanobanana gedacht ist

Der nanobanana-Skill ist ein leichtgewichtiges Wrapper-Tool rund um Googles Modell gemini-3-pro-image-preview für praktische Bildgenerierung und Bildbearbeitung über die Kommandozeile. Er eignet sich besonders für alle, die Bilder wiederholbar und skriptbar erzeugen, Prompt-Varianten testen oder Ausgaben stapelweise generieren möchten, ohne zuerst eine vollständige App zu bauen.

Wer nanobanana installieren sollte

Am besten passt der nanobanana skill für:

  • Entwickler, die bereits mit Python und Umgebungsvariablen arbeiten
  • AI-Operatoren, die reproduzierbare Befehle zur Bildgenerierung möchten
  • Prompt-Tester, die Stile, Seitenverhältnisse und Ausgabegrößen vergleichen
  • Nutzer, die sowohl Text-zu-Bild als auch Bearbeitung bestehender Bilder brauchen

Wenn du nur gelegentlich einzelne Bilder in einer Chat-Oberfläche erzeugen willst, ist der Einrichtungsaufwand hier womöglich größer als nötig.

Der konkrete Anwendungsfall

Die meisten Nutzer suchen nicht abstrakt nach „einem Bildmodell“. Sie wollen ein grobes kreatives Ziel in ein nutzbares Asset verwandeln: ein Produktfoto, eine Landschaft, ein Maskottchen, eine Konzeptillustration oder eine bearbeitete Version eines vorhandenen Bildes. nanobanana for Image Generation ist dafür nützlich, weil es einen direkten CLI-Weg für genau diese Aufgabe bietet – inklusive Prompt-Eingabe, optionalem Quellbild, Auswahl des Seitenverhältnisses und 2K-/4K-Ausgabeoptionen.

Was nanobanana von einem generischen Prompt unterscheidet

Der Hauptunterschied liegt nicht in geheimen Prompt-Tricks, sondern in der Reduktion des Workflows:

  • ein dediziertes Skript für Generierung und Bearbeitung
  • explizite Flags für --ratio und --size
  • API-Einrichtung über Umgebungsvariablen
  • Unterstützung für Batch-Generierung in scripts/batch_generate.py
  • eine Prompt-Referenzdatei mit konkreten Stilmustern in references/prompts.md

Dadurch ist die nanobanana usage konsistenter, als immer wieder ad hoc Prompts in ein allgemeines Chat-Tool einzutippen.

Was vor der Einführung wichtig ist

Die zentralen Fragen vor der Einführung sind einfach:

  • Du brauchst einen GEMINI_API_KEY.
  • Du brauchst Python 3.10+.
  • Du brauchst google-genai und pillow.
  • Du solltest lokale Skripte sicher ausführen können.
  • Du solltest damit rechnen, dass die Bildqualität stark von der Genauigkeit des Prompts abhängt.

Das ist ein praktischer Skill, keine Web-App ohne Konfiguration.

So verwendest du den nanobanana-Skill

nanobanana-Installationsvoraussetzungen

Bevor du nanobanana install ausprobierst, stelle sicher, dass du Folgendes hast:

  • Python 3.10+
  • einen gültigen GEMINI_API_KEY
  • Netzwerkzugriff auf Googles API
  • die Python-Pakete google-genai und pillow

Abhängigkeiten installieren:

pip install google-genai pillow

API-Schlüssel setzen:

export GEMINI_API_KEY="your_api_key_here"

Einen Schlüssel erhältst du unter https://aistudio.google.com/apikey.

Den Skill in deiner Skills-Umgebung installieren

Wenn du das Skills-System nutzt, füge den Skill so hinzu:

npx skills add ReScienceLab/opc-skills --skill nanobanana

Lies nach der Installation zuerst diese Dateien:

  • skills/nanobanana/SKILL.md
  • skills/nanobanana/scripts/generate.py
  • skills/nanobanana/references/prompts.md
  • skills/nanobanana/scripts/batch_generate.py

Mit dieser Reihenfolge kommst du am schnellsten von „Kann ich das nutzen?“ zu „Welche konkreten Befehle sollte ich ausführen?“.

Grundlegende nanobanana usage für Text-zu-Bild

Der Kernbefehl ist das Generate-Skript mit einem Prompt:

python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png

Das ist der richtige Einstieg, wenn du nur von Text ausgehst. Der Ausgabepfad ist optional, aber sinnvoll, damit du später nicht nach automatisch benannten Dateien suchen musst.

Ein bestehendes Bild mit nanobanana bearbeiten

Für die Bildbearbeitung übergibst du sowohl einen Prompt als auch ein Eingabebild:

python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png

Das ist der passende Workflow, wenn du ein Ausgangsbild erhalten und gezielt eine Änderung anfordern willst. Der Prompt sollte die gewünschte Änderung beschreiben, nicht die gesamte Szene neu formulieren – außer du willst bewusst stärkere Abweichungen.

Seitenverhältnis und Ausgabegröße wählen

Der Skill unterstützt gängige Seitenverhältnisse, darunter:
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9

Beispiel:

python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png

Für höhere Auflösung:

python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png

Lege das Seitenverhältnis früh im Workflow fest. Es verändert die Komposition, nicht nur den Beschnitt.

Batch-Generierung nutzen, wenn Prompt-Exploration wichtig ist

scripts/batch_generate.py ist nach dem Hauptskript die wichtigste Datei für die Entscheidungsfindung, weil sie mehrere Generierungen aus einem einzelnen Prompt unterstützt.

Beispiel:

python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo

Parallele Generierung wird ebenfalls unterstützt:

python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5

Das ist besonders hilfreich, wenn du Stile erkundest und nicht auf ein einziges deterministisches Ergebnis zielst.

Welche Eingaben nanobanana gut funktionieren lassen

Ein grobes Ziel wie „make a cool image“ ist meist zu schwach. Stärkere Eingaben enthalten:

  • ein klares Motiv
  • den gewünschten Stil
  • Licht- oder Kamera-Hinweise
  • Kompositionshinweise
  • Qualitäts- oder Ausgabeabsicht

Besserer Prompt:

Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background

Schwächerer Prompt:

headphones advertisement

Die stärkere Variante gibt dem Modell mehr Steuerungssignale und reduziert generische Ergebnisse.

Aus einer groben Idee einen vollständigen Prompt machen

Ein praxisnaher nanobanana guide zum Aufbau von Prompts sieht so aus:

  1. das Motiv benennen
  2. den visuellen Modus festlegen
  3. Szenen- oder Kompositionsdetails ergänzen
  4. Lichtstimmung oder Atmosphäre hinzufügen
  5. Qualitätsmerkmale nur dann ergänzen, wenn sie wirklich helfen

Vorlage aus der Prompt-Referenz des Repos:

Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere

Beispiel:

Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life

Repository-Dateien, die du vor ernsthaftem Einsatz lesen solltest

Wenn du bei der nanobanana usage mehr als nur an der Oberfläche bleiben willst, schau dir an:

  • SKILL.md für Voraussetzungen und Befehlsmuster
  • references/prompts.md für Prompt-Strukturen und Beispielkategorien
  • scripts/generate.py für unterstützte Dateitypen, gültige Seitenverhältnisse und Größen
  • scripts/batch_generate.py für Parallelität, Verzögerungen und Benennungsverhalten
  • .claude-plugin/plugin.json für den Verpackungs- und Integrationskontext

Das ist hilfreicher, als nur flüchtig ins Repo-Root zu schauen, weil der Skill auf wenige Dateien konzentriert ist.

Praktische Grenzen und Abwägungen

Wichtige Grenzen, die sich direkt aus den Skripten ergeben:

  • die Bearbeitung von Eingabebildern hängt von lokal verfügbaren Dateien ab
  • nicht unterstützte oder fehlende Bilddateien führen schon vor der Generierung zu Fehlern
  • Seitenverhältnisse und Größen sind auf bekannte gültige Werte beschränkt
  • der Workflow hängt von Googles Preview-Bildmodell ab, daher kann sich das Verhalten mit Modell-Updates ändern
  • Batch-Generierung erhöht den Durchsatz, aber auch API-Nutzung und möglichen Druck durch Rate Limits

Wenn du fortgeschrittene Bildpipeline-Steuerung, node-basierte Bearbeitung oder eine vollständig gehostete UI brauchst, ist dieser Skill bewusst enger zugeschnitten.

nanobanana-Skill-FAQ

Ist nanobanana gut für Einsteiger?

Ja, wenn du mit grundlegenden Terminal-Befehlen und der Installation von Python-Paketen vertraut bist. Der nanobanana skill ist einfacher, als einen eigenen API-Client von Grund auf zu bauen, bleibt aber ein entwicklerorientiertes Werkzeug und keine Consumer-App.

Wann sollte ich nanobanana statt eines normalen Chat-Prompts verwenden?

Nutze nanobanana, wenn du Folgendes brauchst:

  • gespeicherte Ausgabedateien
  • wiederholbare Befehle
  • Bildbearbeitung mit lokalen Dateien
  • Batch-Generierung
  • explizite Auswahl von Seitenverhältnis und Größe

Ein normaler Chat-Prompt reicht für lockeres Ausprobieren aus, aber dieser Skill ist klar besser, wenn Ausgabe-Handling und Wiederholbarkeit wichtig sind.

Unterstützt nanobanana sowohl Generierung als auch Bearbeitung?

Ja. Unterstützt werden:

  • Text-zu-Bild-Generierung aus einem Prompt
  • Bildbearbeitung mit -i / --input
  • Steuerung des Seitenverhältnisses
  • Ausgabeoptionen in 2K und 4K
  • Batch-Generierung über ein separates Skript

Diese Kombination ist der Hauptgrund, ihn zu installieren, statt nur einen einmaligen Prompt zu schreiben.

Reicht nanobanana for Image Generation für Produktionsarbeit aus?

Es kann in produktionsnahen Workflows nützlich sein, etwa für Konzeptgenerierung, Asset-Ideation, Prompt-Exploration oder Batch-Experimente bei der Erstellung. Als vollständige Produktpipeline reicht es allein jedoch nicht aus. Du brauchst weiterhin eigene Schritte für Review, Auswahl, Speicherung und gegebenenfalls Nachbearbeitung.

Wann ist nanobanana keine gute Wahl?

Verzichte auf nanobanana install, wenn du Folgendes brauchst:

  • eine browserzentrierte No-Code-Erfahrung
  • einen vollständig verwalteten GUI-Workflow
  • komplexe mehrstufige Edit-Orchestrierung
  • starke Garantien für stabiles Modellverhalten über die Zeit
  • Bildgenerierung ohne Abhängigkeit von einer externen API

Seine Stärke liegt in einer schlanken, praktischen Skript-Schicht.

So verbesserst du den nanobanana-Skill

Mit präziseren Prompts starten

Der schnellste Weg zu besseren Ergebnissen mit nanobanana ist, Prompts konkreter zu machen. Ergänze Motiv, Stil, Komposition und Licht, statt dich auf Adjektive wie „cool“ oder „beautiful“ zu verlassen.

Schwach:

a nice city

Stärker:

Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition

Prompt-Stil an den Ausgabetyp anpassen

Verwende je nach Ziel unterschiedliche Prompt-Sprache:

  • pixel art: begrenzte Farbpalette, klare Pixel, Retro-Game-Anmutung nennen
  • photorealistic: Linse, Licht, Fokus und Materialrealismus nennen
  • illustration: Kunststil, Palette, Atmosphäre sowie Pinsel- oder Rendering-Anmutung nennen

Diese Ausrichtung ist eine der praktischsten Ideen in references/prompts.md.

Bildbearbeitung verbessern, indem du nur die gewünschte Änderung beschreibst

Bei Edit-Workflows prompten viele Nutzer zu viel. Wenn du bereits ein Eingabebild übergibst, beginne mit der konkreten Änderung:

Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent

Das ist in der Regel besser, als das gesamte Bild von Grund auf neu zu beschreiben – außer du möchtest tatsächlich eine umfassendere Neuinterpretation.

Mit Batch-Generierung explorieren und dann eingrenzen

Ein guter iterativer Workflow für die nanobanana usage ist:

  1. 6–20 Varianten zu einem Prompt-Thema generieren
  2. erkennen, was in den besten Ergebnissen funktioniert hat
  3. den Prompt rund um diese erfolgreichen Merkmale neu formulieren
  4. mit engerer Stilbeschreibung oder anderem Seitenverhältnis erneut ausführen

Das ist effizienter, als einen abstrakten Prompt endlos zu polieren, bevor du überhaupt ein Ergebnis gesehen hast.

Typische Fehlermuster, auf die du achten solltest

Häufige Qualitätsprobleme sind:

  • zu vage Prompts
  • ein unpassendes Seitenverhältnis für das Motiv
  • überladene Prompts mit widersprüchlichen Stilvorgaben
  • Edit-Prompts, die unbeabsichtigt eine komplette Neuschreibung der Szene verlangen
  • die Annahme, dass 4K allein ein schwaches Konzept rettet

Die meisten schlechten Ergebnisse liegen an der Qualität der Anweisungen, nicht an fehlenden magischen Schlüsselwörtern.

Seitenverhältnis als kreatives Werkzeug nutzen, nicht als Nachgedanken

Für bessere nanobanana for Image Generation-Ergebnisse:

  • nutze 1:1 für Icons, Avatare und enge Produkt-Crops
  • nutze 9:16 für vertikale, mobile-first Szenen
  • nutze 16:9 oder 21:9 für cineastische Landschaften
  • nutze 4:5 für posterartige Kompositionen

Das falsche Seitenverhältnis führt oft zu zu engem Framing oder verschenktem Raum.

Mehr Vertrauen gewinnen, indem du die Skripte direkt testest

Wenn ein Skill unklar wirkt, führe die Skripte selbst aus, bevor du ihn beurteilst. scripts/generate.py und scripts/batch_generate.py sind kurz genug, um sie direkt zu prüfen. So kannst du unterstützte Optionen, Fehlerpfade und Benennungsverhalten verifizieren. In diesem Repo schafft der direkte Blick in die Skripte mehr Vertrauen als eine rein übergeordnete Beschreibung.

Die beste nächste Verbesserung, wenn das erste Ergebnis knapp danebenliegt

Starte nicht komplett neu. Ändere jeweils nur eine Variable:

  • Motivdetails
  • Stilformulierung
  • Lichthinweis
  • Seitenverhältnis
  • Umfang der Bearbeitungsanweisung

So lernst du leichter, worauf das Modell reagiert, und verbesserst schnell dein Gespür im zukünftigen nanobanana guide.

Bewertungen & Rezensionen

Noch keine Bewertungen
Teile deine Rezension
Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.
G
0/10000
Neueste Rezensionen
Wird gespeichert...