nanobanana
作成者 ReScienceLabnanobanana は、Google Gemini 3 Pro Image 向けの Python CLI スキルです。シンプルなローカルスクリプトで、テキストからの画像生成、画像編集、アスペクト比指定、2K/4K 出力、バッチ生成に対応します。
このスキルの評価は 78/100 です。ディレクトリ掲載候補として十分に有力で、エージェントが起動条件を判断しやすく、Gemini ベースの画像生成・編集に使える具体的なコマンドや実行可能なスクリプトがそろっています。一方で、初期設定やモデル固有の不確実さには、利用者自身で対応する必要があります。
- 呼び出し条件が明確です。frontmatter に、Gemini の画像生成で画像を生成・編集する用途に使うことがはっきり示されています。
- 実運用をイメージしやすい構成です。SKILL.md に前提条件、`pip install` コマンド、クイックスタート例、CLI の使い方、出力・編集オプションまで具体的にまとまっています。
- 単なるプロンプト入力にとどまらない実務的な価値があります。同梱の `generate.py` と `batch_generate.py` により、text-to-image、画像編集、アスペクト比指定、2K/4K 出力、バッチ生成を扱えます。
- 導入には外部セットアップが必要です。利用者は `GEMINI_API_KEY` を用意し、Python 3.10+、`google-genai`、Pillow をインストールする必要があります。
- 信頼性や明確さの面ではまだ留意点があります。このスキルは preview モデルの `gemini-3-pro-image-preview` に依存しており、提示されている内容にも、トラブルシュート、エラー時の案内、SKILL.md 内での導入自動化は含まれていません。
nanobanana skill の概要
nanobanana は何に使うものか
nanobanana は、Google の gemini-3-pro-image-preview モデルをコマンドラインから実用的に使うための軽量ラッパーです。画像生成にも既存画像の編集にも対応しており、まずはフルアプリを作り込む前に、再現しやすくスクリプト化できる形で画像を作りたい人、プロンプト違いを比較したい人、複数の出力をまとめて生成したい人に向いています。
nanobanana を導入すべき人
nanobanana skill が特に合うのは、次のようなユーザーです。
- すでに Python と環境変数に慣れている開発者
- 再現性のある画像生成コマンドを使いたい AI 運用担当者
- スタイル・アスペクト比・出力サイズを比較検証したいプロンプトテスター
- テキストからの画像生成と、既存画像の編集をどちらも使いたいユーザー
一方で、チャット UI 上でたまに単発の画像生成をするだけなら、必要なセットアップはやや重く感じるはずです。
実際に片付けたい仕事
多くのユーザーが欲しいのは、抽象的な意味での「画像モデル」ではありません。ざっくりしたクリエイティブの目的を、実際に使える成果物に変える手段です。たとえば商品画像、風景、マスコット、コンセプトイラスト、あるいは既存画像の編集版などです。nanobanana for Image Generation が役立つのは、その仕事に対して CLI からまっすぐ到達できるからです。プロンプト入力、任意の元画像入力、アスペクト比の指定、さらに 2K / 4K 出力まで一通り押さえられています。
nanobanana が汎用プロンプト入力と違う点
差別化ポイントは、秘密のプロンプトではありません。中心にあるのはワークフローの簡略化です。
- 生成と編集に特化した専用スクリプト
--ratioと--sizeの明示的な指定- 環境変数ベースの API セットアップ
scripts/batch_generate.pyによるバッチ生成references/prompts.mdにまとまった具体的なスタイル別プロンプト例
そのため、汎用チャットツールで毎回その場しのぎのプロンプトを手打ちするよりも、nanobanana の運用のほうが安定しやすいのが特徴です。
導入前に確認したいこと
導入判断で見るべき点はシンプルです。
GEMINI_API_KEYが必要です。- Python
3.10+が必要です。 google-genaiとpillowが必要です。- ローカルスクリプトの実行に抵抗がないほうが向いています。
- 画像品質はプロンプトの具体性に大きく左右されます。
これは手軽なノーコンフィグの Web アプリではなく、実務寄りの skill です。
nanobanana skill の使い方
nanobanana のインストール要件
nanobanana install を試す前に、以下を確認してください。
- Python
3.10+ - 有効な
GEMINI_API_KEY - Google API へ接続できるネットワーク環境
- Python パッケージ
google-genaiとpillow
依存関係のインストール:
pip install google-genai pillow
API キーの設定:
export GEMINI_API_KEY="your_api_key_here"
キーの取得先は https://aistudio.google.com/apikey です。
skills 環境に skill をインストールする
skills システムを使っている場合は、次のコマンドで skill を追加します。
npx skills add ReScienceLab/opc-skills --skill nanobanana
インストール後は、まず次のファイルから読むのがおすすめです。
skills/nanobanana/SKILL.mdskills/nanobanana/scripts/generate.pyskills/nanobanana/references/prompts.mdskills/nanobanana/scripts/batch_generate.py
この順番で見ていくと、「自分に使えるのか?」から「具体的にどのコマンドを打てばいいのか?」まで最短で把握できます。
テキストから画像を作る nanobanana の基本的な使い方
基本コマンドは、プロンプトを渡して generate スクリプトを実行する形です。
python3 <skill_dir>/scripts/generate.py "a cute robot mascot, pixel art style" -o robot.png
テキストだけから始めるなら、この使い方が基本です。出力パスは省略できますが、指定しておくとあとで自動命名ファイルを探し回らずに済みます。
nanobanana で既存画像を編集する
画像編集では、プロンプトと入力画像の両方を指定します。
python3 <skill_dir>/scripts/generate.py "make the background blue" -i input.jpg -o output.png
元画像を活かしながら、狙った変更だけを加えたいときに適したワークフローです。プロンプトではシーン全体を言い直すより、変えたい内容を中心に書くほうが有効です。大きく作り替えたい場合だけ、全体の再記述を検討してください。
アスペクト比と出力サイズを選ぶ
この skill は、次のような一般的なアスペクト比に対応しています。
1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
例:
python3 <skill_dir>/scripts/generate.py "cinematic landscape at sunrise" --ratio 21:9 -o landscape.png
高解像度で出したい場合:
python3 <skill_dir>/scripts/generate.py "professional product photo of headphones" --size 4K -o product.png
アスペクト比はワークフローの早い段階で決めるのが重要です。単なるトリミングではなく、構図そのものに影響します。
プロンプト検証をするならバッチ生成を使う
scripts/batch_generate.py は、メインスクリプトの次に判断材料として重要なファイルです。1つのプロンプトから複数パターンを生成できます。
例:
python3 <skill_dir>/scripts/batch_generate.py "pixel art logo" -n 20 -d ./logos -p logo
並列生成にも対応しています。
python3 <skill_dir>/scripts/batch_generate.py "landscape concept art" -n 20 --parallel 5
1枚の決定版を狙うというより、スタイルの方向性を探りたいときに特に便利です。
nanobanana がうまく働く入力とは
「かっこいい画像を作って」のような曖昧な指示は、たいてい弱すぎます。より良い入力には、次の要素が含まれます。
- 主題が明確
- 意図するスタイルがある
- 光やカメラに関する手がかりがある
- 構図のヒントがある
- 品質や用途に関する意図がある
より良いプロンプト:
Professional product photo of wireless headphones on marble surface, soft studio lighting, 85mm lens, sharp focus, minimalist background
弱いプロンプト:
headphones advertisement
前者のほうがモデルに与える制御信号が多く、無難で凡庸な出力になりにくくなります。
ラフな発想を完成度の高いプロンプトにする
実用的な nanobanana guide としては、プロンプトを次の順で組み立てるのがおすすめです。
- 主題を書く
- ビジュアルの種類を指定する
- シーンや構図の情報を足す
- 光やムードを加える
- 必要なときだけ品質の手がかりを加える
リポジトリのプロンプトリファレンスにあるテンプレート:
Digital illustration of {subject}, {style} style, {colors} color palette, {mood} atmosphere
例:
Digital illustration of an underwater research base, retro-futurist style, cyan and amber palette, mysterious atmosphere, detailed windows, glowing marine life
本格利用の前に読んでおきたいリポジトリ内ファイル
表面的な nanobanana の使い方 以上を知りたいなら、次を確認してください。
SKILL.md: 前提条件とコマンドパターンreferences/prompts.md: プロンプト構造とカテゴリ別の具体例scripts/generate.py: 対応ファイル形式、有効なアスペクト比、サイズ指定scripts/batch_generate.py: 並列実行、待機、命名ルール.claude-plugin/plugin.json: パッケージングの前提
リポジトリのルートをざっと眺めるより、この skill は読むべき箇所がかなり絞られています。
実運用での制約とトレードオフ
スクリプトから見えてくる重要な制約は次のとおりです。
- 入力画像の編集は、ローカルにファイルが存在していることが前提です
- 非対応形式や存在しない画像ファイルは、生成前の段階で失敗します
- アスペクト比とサイズは、あらかじめ決められた有効値に限定されます
- ワークフローは Google の preview image model に依存するため、モデル更新で挙動が変わる可能性があります
- バッチ生成は処理量を増やせますが、そのぶん API 使用量やレート制限の圧力も高まります
高度な画像パイプライン制御、ノードベース編集、あるいはフル機能のホスト型 UI が必要なら、この skill は意図的に守備範囲を絞っています。
nanobanana skill の FAQ
nanobanana は初心者にも向いているか
はい。基本的なターミナル操作と Python パッケージのインストールに抵抗がなければ扱えます。nanobanana skill は API クライアントをゼロから自作するより簡単ですが、一般消費者向けアプリというより、あくまで開発者寄りのツールです。
通常のチャットプロンプトではなく nanobanana を使うべき場面は
次のような要件があるなら nanobanana を使う価値があります。
- 出力ファイルを保存したい
- 同じ条件で繰り返し実行したい
- ローカルファイルを使った画像編集をしたい
- バッチ生成をしたい
- アスペクト比やサイズを明示的に指定したい
気軽な試行なら通常のチャットプロンプトでも十分ですが、出力管理や再現性が重要になる場面では、この skill のほうが向いています。
nanobanana は生成と編集の両方に対応しているか
はい。対応しているのは次の機能です。
- プロンプトからの text-to-image 生成
-i/--inputを使った画像編集- アスペクト比の制御
2Kと4Kの出力設定- 別スクリプトによるバッチ生成
単発のプロンプトを書くだけで済ませず、あえて導入する主な理由はこの組み合わせにあります。
nanobanana for Image Generation だけで本番運用に足りるか
コンセプト生成、アセット案出し、プロンプト探索、バッチ作成の実験といった、本番周辺のワークフローには十分役立ちます。ただし、それ単体で完結したプロダクト用パイプラインではありません。レビュー、選定、保存、必要に応じた後処理は、別途自分で用意する必要があります。
nanobanana が向かないケースは
次の条件が必要なら、nanobanana install は見送ったほうがよいでしょう。
- ブラウザ中心のノーコード体験
- 完全に管理された GUI ワークフロー
- 複雑な多段編集のオーケストレーション
- 長期的に安定したモデル挙動への強い保証
- 外部 API に依存しない画像生成
この skill の強みは、薄くて実務的なスクリプト層にあります。
nanobanana skill を改善する方法
まずはプロンプトの具体性を上げる
nanobanana の結果を最も手早く改善する方法は、プロンプトを具体的にすることです。"cool" や "beautiful" のような形容詞に頼るのではなく、主題、スタイル、構図、ライティングを入れてください。
弱い例:
a nice city
より強い例:
Aerial photograph of a dense coastal city at golden hour, dramatic shadows, high dynamic range, realistic urban detail, cinematic composition
出力タイプに合わせてプロンプトの書き方を変える
目的ごとに使う言葉を切り替えましょう。
- pixel art: 限られた色数、くっきりしたピクセル感、レトロゲーム風を入れる
- photorealistic: レンズ、ライティング、フォーカス、素材感のリアルさを入れる
- illustration: 画風、配色、空気感、筆致やレンダリング感を入れる
この合わせ込みは、references/prompts.md の中でも特に実践的なポイントです。
画像編集では変えたい部分だけを書く
編集ワークフローでは、書きすぎるユーザーが少なくありません。入力画像をすでに渡しているなら、まずは変更したい点だけを具体的に指示してください。
Replace the gray wall with a warm blue studio backdrop while keeping the product position and lighting consistent
全体を大きく再解釈したいのでなければ、画像全体を最初から書き直すより、こちらのほうがうまくいくことが多いです。
バッチ生成で広く探ってから絞り込む
nanobanana の運用で有効な反復手順は次のとおりです。
- 1つのプロンプトテーマで 6〜20 バリエーション生成する
- 出力の中で良かった要素を見つける
- その勝ち筋を軸にプロンプトを書き直す
- スタイル記述を絞るか、アスペクト比を変えて再実行する
出力を見る前に、抽象的なプロンプトを延々と磨き続けるより効率的です。
よくある失敗パターンを把握しておく
典型的な品質問題には次のようなものがあります。
- プロンプトが曖昧すぎる
- 主題に対してアスペクト比が合っていない
- スタイル指定を詰め込みすぎて矛盾している
- 編集プロンプトが意図せずシーン全体の作り直しを要求している
- 4K にすれば弱いコンセプトも改善すると考えてしまう
良くない出力の大半は、魔法のキーワード不足ではなく、指示の質に起因します。
アスペクト比は後回しではなく創作上の制御として使う
より良い nanobanana for Image Generation の結果を得るには、次の目安が有効です。
1:1: アイコン、アバター、商品切り抜き9:16: 縦長のモバイル向けシーン16:9または21:9: シネマティックな風景4:5: ポスター寄りの構図
アスペクト比を誤ると、画面が窮屈になったり、逆に余白を持て余したりしやすくなります。
スクリプトを直接確認して判断の精度を上げる
skill の説明が分かりにくいと感じたら、評価する前に実際にスクリプトを見て実行してみてください。scripts/generate.py と scripts/batch_generate.py は短く、対応オプション、失敗パターン、命名ルールを確認しやすい構成です。このリポジトリでは、高レベルの説明だけに頼るより、スクリプトを直接確認したほうが安心して判断できます。
最初の出力が惜しいときの次の一手
全部をやり直す必要はありません。1回に変えるのは 1 要素ずつにしてください。
- 主題の詳細
- スタイル表現
- ライティング指定
- アスペクト比
- 編集指示の範囲
そうすると、モデルがどの指示に反応しているか学びやすくなり、今後の nanobanana guide の勘所も早く育ちます。
