ai-image-generation
作成者 inferen-shFLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image、Grok Imagine、Seedream 4.5、Reve、ImagineArt などを含む 50 以上のモデルを inference.sh CLI 経由で利用して AI 画像を生成します。テキストからの画像生成、image-to-image、インペインティング、LoRA、画像編集、アップスケーリング、テキスト描画に対応し、AI アート、プロダクトのモック、コンセプトアート、SNS 画像、マーケティングビジュアル、イラスト制作に活用できます。
概要
ai-image-generation とは?
ai-image-generation スキルは、inference.sh コマンドラインインターフェイスを通じて、50 以上の AI 画像モデルをエージェントや CLI ワークフローから利用できるようにするものです。AI アート、マーケティング用ビジュアル、プロダクトモック、コンセプトアート、SNS 画像などを、実務的でスクリプトしやすい形で生成することに特化しています。
内部的には、infsh CLI を使って FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image、Grok Imagine、Seedream 4.5、Reve、ImagineArt などの既製 “apps” を呼び出し、テキストからの画像生成や画像編集モデルを扱います。
主な機能
- Text-to-image: 自然言語のプロンプトから画像を生成。
- Image-to-image: 既存の画像を元に、新しいバリエーションを生成。
- Inpainting & editing: 画像の一部だけを指定して編集し、全体を描き直さずに変更。
- LoRA サポート: LoRA ベースの FLUX モデルで、柔軟なスタイル転写や細かな調整が可能。
- アップスケーリング: 既存画像の解像度とシャープさを向上。
- テキスト描画: 広告、バナー、SNS 投稿向けに、読みやすい文字を含む画像を生成。
このスキルが向いているユーザー
ai-image-generation は、次のような方に適しています。
- マーケティング / SNS 担当者 で、コマンドラインから素早くブランドに沿ったビジュアルを作りたい。
- 多様な画像モデルを呼び分ける 自動化やエージェントのワークフロー を構築している。
- Web ダッシュボードよりも、CLI を通じた API ライクなアクセスを好む開発者。
- CI、cron、コンテンツパイプラインに組み込める、スクリプト可能な Midjourney / DALL·E の代替 を探している。
逆に、次のような場合には適さない可能性があります。
- ターミナル操作なしで使える、完全な GUI ツールだけを求めている。
- モデルを自前でホスティングしたい(このスキルは inference.sh のホスティング環境が前提です)。
対応モデルの例
リポジトリの SKILL.md では、複数の画像 app が紹介されています(一部抜粋):
- FLUX Dev LoRA (
falai/flux-dev-lora) – 高品質かつカスタムスタイル対応。 - FLUX.2 Klein LoRA (
falai/flux-2-klein-lora) – 高速で LoRA 対応のモデル。 - Gemini 3 Pro Image – Google Gemini ベースの画像生成。
- Grok Imagine – Grok による画像生成。
- Seedream 4.5、Reve、ImagineArt – クリエイティブ表現やイラスト向けのモデル。
これらはすべて inference.sh の app として公開されており、infsh app run ... という同じパターンで操作します。
使い方
1. 前提条件
ai-image-generation を有効に活用するには、以下が必要です。
- inference.sh アカウント – https://inference.sh で登録し、認証情報を取得します。
- inference.sh CLI (
infsh) – スキルは内部でinfshを呼び出します。 - Bash 互換環境 – このスキルは
Bash(infsh *)の利用を許可しているため、Linux、macOS、または Windows 上の WSL が最適です。
CLI のインストール手順は公式のリポジトリを参照してください。
- CLI インストールスクリプト:
https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
最低限、以下のコマンドがエラーなく実行できる状態にしておきます。
infsh --help
この状態になってから、エージェントにスキルを組み込んでください。
2. ai-image-generation スキルのインストール
このリポジトリを読み込む Agent Skills エコシステムを利用している場合、通常は次のようにインストールします。
npx skills add https://github.com/inferen-sh/skills --skill ai-image-generation
これにより、tools/image/ai-image-generation から ai-image-generation スキルが取得され、そのメタデータとツール設定がエージェントで利用できるようになります。
3. inference.sh にログイン
ai-image-generation は、事前に infsh が認証済みであることを前提とします。
infsh login
ターミナルまたはブラウザで表示されるログインフローに従って認証します。ログインが完了すると、その後の infsh app run ... コマンドで自分のアカウントのクォータや課金枠を利用できるようになります。
4. 最初の text-to-image を実行する
SKILL.md のクイックスタートでは、FLUX Dev LoRA app を使った画像生成例が紹介されています。
infsh app run falai/flux-dev-lora --input '{"prompt": "a cat astronaut in space"}'
このパターンが ai-image-generation の基本です。
- 使用する App ID を選ぶ(例:
falai/flux-dev-lora)。 - プロンプトと追加パラメータを含む input JSON ペイロードを渡す。
- CLI 出力を取得し、生成された画像の URL やファイル参照を取得する。
エージェント側でこのスキルを設定すれば、同じ CLI 呼び出しをプログラム的に構築できます。
5. 利用するモデルを切り替える
このスキルは特定のモデルに固定されていません。タスクごとに最適な inference.sh app を選んで使います。
- 高品質でスタイライズされたアート: FLUX Dev LoRA (
falai/flux-dev-lora)。 - LoRA 対応かつ高速: FLUX.2 Klein LoRA (
falai/flux-2-klein-lora)。 - Gemini ベースの画像生成: Gemini 3 Pro Image。
- Grok によるビジュアル生成: Grok Imagine。
- 汎用的なマーケティング / イラスト用途: Seedream 4.5、Reve、ImagineArt を試す。
実際には、コマンドの違いは App ID だけです。
# 例: FLUX.2 Klein LoRA を使う
infsh app run falai/flux-2-klein-lora --input '{"prompt": "product render of a modern smartwatch on a marble table"}'
6. エージェントやスクリプトへの組み込み
ai-image-generation は Bash(infsh *) ベースで動作するため、次のような用途に組み込みやすい設計です。
- モデルを選択して画像を生成し、その URL をユーザーに返す エージェントワークフロー。
- 定期的に SNS 画像やブログ用イラストを生成する cron ジョブ。
- デザインモックや更新スクリーンショットを生成する CI パイプライン。
エージェント文脈では、一般的に次のような流れになります。
SKILL.mdなどからai-image-generationのスキルメタデータを読み込む。- エージェントに、必要に応じて
infsh app run ...を呼び出す権限を与える。 - CLI 出力をパースし、エージェントが生成されたアセットを参照できるようにする。
7. 画像編集・インペインティング・アップスケーリングの利用
ai-image-generation は、image-to-image、インペインティング、LoRA を使ったスタイル転写、アップスケーリングに対応したモデルも扱えます。入力仕様はモデルによって異なりますが、基本的な流れは共通しています。
- 元画像 を指定する(通常は inference.sh がサポートする URL またはファイル参照)。
- 実施したい編集内容を示す プロンプトやマスク を追加する。
- 利用したい機能に対応した App ID を選ぶ(例: inference.sh apps カタログに掲載されているアップスケーラーやインペインティングモデル)。
詳細な入力項目はモデルごとに異なり、inference.sh 側のドキュメントに記載されています。CLI の基本パターンはそのままに、各 app のドキュメントを参照しながら設定してください。
FAQ
ai-image-generation スキルは何をインストールしますか?
ai-image-generation スキルは、ローカル環境にモデル本体をインストールするわけではありません。エージェントが inference.sh 上のホストモデルに対して infsh CLI を安全に呼び出せるようにするためのメタデータと設定を追加します。大きな計算処理は inference.sh プラットフォーム側で実行されます。
ai-image-generation を使うには inference.sh CLI が必須ですか?
必須です。このスキルは allowed-tools: Bash(infsh *) を宣言しており、すべての操作は infsh バイナリを中心に構成されています。画像の生成や編集を行う前に、inference.sh CLI をインストールし、認証を完了しておく必要があります。
ai-image-generation で利用できる AI モデルは?
このスキルは、inference.sh 上で提供されている 50 以上の画像系 app と連携できるように設計されています。リポジトリでは特に次のモデルが言及されています。
- FLUX Dev LoRA
- FLUX.2 Klein LoRA
- Gemini 3 Pro Image
- Grok Imagine
- Seedream 4.5
- Reve
- ImagineArt
これ以外の app も inference.sh 上で探索でき、同じ infsh app run ... インターフェイスで呼び出せます。
SNS やマーケティング用の画像にも使えますか?
はい。ai-image-generation スキルは次のような用途に適しています。
- SNS 投稿や広告クリエイティブ
- ブログのヘッダー画像やヒーローイメージ
- プロダクトモックやプロモーション用ビジュアル
- キャンペーンを支える簡易コンセプトアート
ワークフローが CLI ベースのため、定型的なコンテンツ生成を自動化し、既存のマーケティングパイプラインに組み込むことができます。
ターミナルを使わない場合でも ai-image-generation は向いていますか?
あまり向いていません。ai-image-generation は CLI やエージェント環境での利用に最適化されています。ドラッグ&ドロップ中心の操作や、完全に Web ベースのツールを好む場合は、GUI 型の画像生成サービスの方が使いやすいでしょう。一方で、簡単なコマンドを実行する、あるいはコマンドを裏側で代行するエージェントを利用するのであれば、このスキルも十分に活用できます。
ai-image-generation で使うモデルを自前でホスティングできますか?
リポジトリの情報は、inference.sh のホスト型プラットフォーム経由での利用のみを想定しています。このスキルはセルフホスティング手段としては記載されておらず、inference.sh のインフラと料金モデルを前提に計画する必要があります。
画像生成でエラーが出たときのトラブルシュート方法は?
ai-image-generation を経由した呼び出しでエラーが発生した場合は、次を確認してください。
- 対応する
infsh app run ...コマンドをターミナルで直接実行し、認証や入力エラーの有無を確認する。 infsh loginを実行して、CLI がログイン済みであることを確かめる。- 使用している App ID と input JSON が、inference.sh のドキュメントに記載されている仕様と一致しているか確認する。
直接 CLI での実行が成功する場合は、その引数と設定がエージェント側にも正しく反映されているかを見直してください。
さらに詳しい使用例はどこで見られますか?
ai-image-generation ディレクトリ内の SKILL.md に、クイックスタートや利用可能なモデルの一覧表が掲載されています。プロンプト例やパラメータ設定、より高度なオプションなど、モデル固有の詳細な例については、https://inference.sh 上の各 app ページとドキュメントを参照してください。
