ai-image-generation

作者 inferen-sh

透過 inference.sh CLI 搭配超過 50 個模型產生 AI 圖片，其中包含 FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image、Grok Imagine、Seedream 4.5、Reve 以及 ImagineArt。支援文字轉圖像、圖生圖、局部修補（inpainting）、LoRA、影像編輯、超解析（upscaling）與文字排版，可用於 AI 藝術、產品情境圖、概念設計、社群貼文視覺、行銷素材與插畫等。

Stars232

評論0

分類影像生成

安裝指令

npx skills add https://github.com/inferen-sh/skills --skill ai-image-generation

Ai Marketing Social Media Cli Bash API

總覽

概觀

什麼是 ai-image-generation？

ai-image-generation 技能讓你的 agent 或 CLI 工作流程，能透過 inference.sh 命令列介面接上 50 多種 AI 影像模型。它聚焦在實用、可編排腳本的影像生成，用於 AI 藝術、行銷視覺、產品示意圖、概念設計與社群貼文圖像。

在底層，這個技能依賴 infsh CLI 來呼叫一系列現成的「apps」，例如 FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image、Grok Imagine、Seedream 4.5、Reve、ImagineArt，以及其他文字轉圖像與影像編輯模型。

主要功能

Text-to-image（文字轉圖像）：從自然語言提示生成圖片。
Image-to-image（圖生圖）：將現有圖片轉換成新的變化版本。
Inpainting 與編輯：只修改影像中特定區域，而不需整張重畫。
LoRA 支援：使用基於 LoRA 的 FLUX 模型，彈性實現風格轉換與微調。
Upscaling（超解析）：提升現有圖片的解析度與銳利度。
文字排版：生成內含清晰文字的圖片，適合廣告、Banner 與社群貼文。

適合哪些使用者？

如果你符合以下情境，ai-image-generation 會是很合適的選擇：

在行銷或社群媒體領域工作，需要從命令列快速產出符合品牌調性的視覺素材。
建構需要呼叫多種影像模型的自動化流程或 agent 工作流。
是偏好透過 CLI 取得類 API 存取方式、而非使用網頁儀表板的開發者。
需要一個可透過腳本控制、能整合進 CI、排程（cron jobs）或內容產線的 Midjourney / DALL·E 替代方案。

以下情境則較不適合：

希望完全圖形化介面，不想使用終端機。
需要自架模型；此技能是以 inference.sh 雲端託管平台為核心設計。

模型涵蓋範圍（範例）

此套件庫的 SKILL.md 列出了多個影像 app，包含但不限於：

FLUX Dev LoRA（falai/flux-dev-lora）– 高品質並支援自訂風格。
FLUX.2 Klein LoRA（falai/flux-2-klein-lora）– 更快速、適合 LoRA 的模型。
Gemini 3 Pro Image – 基於 Google Gemini 的圖像生成。
Grok Imagine – 由 Grok 驅動的影像生成。
Seedream 4.5、Reve、ImagineArt – 其他偏重創作與插畫的模型。

上述模型都以 inference.sh apps 的形式提供，你可透過相同的 infsh app run ... 指令模式來操作。

使用方式

1. 前置需求

要有效使用 ai-image-generation，你需要具備：

inference.sh 帳號 – 前往 https://inference.sh 註冊取得憑證。
inference.sh CLI（infsh） – 這個技能在底層會呼叫 infsh。
相容 Bash 的環境 – 技能宣告允許使用 Bash(infsh *)，因此 Linux、macOS 或 Windows 上的 WSL 是最合適的環境。

依照套件庫中的官方 CLI 安裝說明進行安裝：

CLI 安裝腳本：https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md

至少在串接技能到 agent 之前，你應該可以順利執行：

infsh --help

且不出現錯誤。

2. 安裝 ai-image-generation 技能

若你使用的是會讀取此套件庫的 Agent Skills 生態系，通常可以透過以下方式安裝：

npx skills add https://github.com/inferen-sh/skills --skill ai-image-generation

這會從 tools/image/ai-image-generation 抓取 ai-image-generation 技能，並將其中繼資料與工具設定提供給你的 agent 使用。

3. 登入 inference.sh

ai-image-generation 假設 infsh 已完成驗證登入。

infsh login

依照終端機或瀏覽器中的登入流程操作。完成驗證後，後續的 infsh app run ... 指令就會使用你帳號的額度與計費。

4. 執行第一個文字轉圖像生成

SKILL.md 的快速上手範例示範如何用 FLUX Dev LoRA app 生成影像：

infsh app run falai/flux-dev-lora --input '{"prompt": "a cat astronaut in space"}'

這種模式是 ai-image-generation 的核心：

選擇一個 App ID（例如 falai/flux-dev-lora）。
傳入描述提示詞與其他參數的 input JSON 載荷。
取得 CLI 輸出，其中通常會包含產生圖片的 URL 或檔案引用。

當你的 agent 配置好這個技能後，就能以程式方式組出相同的 CLI 呼叫。

5. 在不同模型之間切換

此技能不會把你綁定在單一模型上，而是讓你視任務選擇最合適的 inference.sh app：

需要高品質、風格化藝術圖：使用 FLUX Dev LoRA（falai/flux-dev-lora）。
需要速度且支援 LoRA：使用 FLUX.2 Klein LoRA（falai/flux-2-klein-lora）。
需要 Gemini 系列的圖像生成：選擇 Gemini 3 Pro Image。
想產生 由 Grok 驅動的視覺內容：使用 Grok Imagine。
一般行銷與插畫需求：可以多試 Seedream 4.5、Reve 與 ImagineArt。

實務上，你的指令只會因 App ID 而異：

# 範例：使用 FLUX.2 Klein LoRA
infsh app run falai/flux-2-klein-lora --input '{"prompt": "product render of a modern smartwatch on a marble table"}'

6. 串接到 agents 與腳本

由於 ai-image-generation 是透過 Bash(infsh *) 驅動，非常適合整合進：

由 agent 協調的流程：選擇模型、生成影像，然後把產生的 URL 回傳給使用者。
Cron 排程工作：定期產出新的社群貼文圖或部落格插圖。
CI 流水線：自動生成設計 mockup 或更新版截圖。

在 agent 的情境中，典型流程是：

載入 ai-image-generation 的技能中繼資料（例如從 SKILL.md）。
允許 agent 在需要圖片時呼叫 infsh app run ...。
解析 CLI 的輸出，讓 agent 能引用產生出的資產。

7. 使用影像編輯、局部修補與超解析

ai-image-generation 也提供支援 image-to-image、inpainting、基於 LoRA 的風格轉換與 upscaling 的模型。雖然各模型的輸入細節不同，基本流程相似：

提供一張來源影像（通常是 inference.sh 支援的 URL 或檔案引用）。
加上描述編輯內容的提示詞或遮罩（mask）。
選擇對應功能的 App ID（例如 inference.sh apps catalog 中的某個 upscaler 或 inpainting 模型）。

由於這些細節與模型高度相關並且維護在 inference.sh 上，建議在維持相同 CLI 呼叫模式的前提下，搭配各 app 的官方文件使用。

常見問題（FAQ）

安裝 ai-image-generation 技能時實際會裝什麼？

ai-image-generation 技能不會在你的機器上安裝模型。它會安裝讓 agent 能安全呼叫 infsh CLI 的中繼資料與設定，並對接 inference.sh 上託管的模型。計算量較大的部分都在 inference.sh 平台上執行。

使用 ai-image-generation 一定要安裝 inference.sh CLI 嗎？

是的。此技能宣告 allowed-tools: Bash(infsh *)，代表所有操作都是以 infsh 這個執行檔為核心。你必須先安裝並完成 inference.sh CLI 的驗證登入，技能才能生成或編輯圖片。

透過 ai-image-generation 可以存取哪些 AI 模型？

這個技能是為 inference.sh 平台上的 50 多個影像相關 apps 設計的。套件庫中特別提到：

FLUX Dev LoRA
FLUX.2 Klein LoRA
Gemini 3 Pro Image
Grok Imagine
Seedream 4.5
Reve
ImagineArt

你可以直接在 inference.sh 上瀏覽更多 apps，並用相同的 infsh app run ... 介面來呼叫它們。

可以用 ai-image-generation 來做社群與行銷用的視覺嗎？

可以。ai-image-generation 特別適合：

社群貼文與廣告素材
部落格首圖與 hero image
產品 mockup 與宣傳視覺
支援行銷活動的快速概念草圖

由於流程是以 CLI 為主，你可以將重複性的內容產出自動化，並納入既有的行銷內容產線。

如果我不習慣用終端機，ai-image-generation 還適合我嗎？

可能不那麼適合。ai-image-generation 是為 CLI 與 agent 環境最佳化設計的。如果你偏好拖拉式介面或純網頁工具，具備 GUI 的影像生成器可能會更符合習慣。不過，只要你願意執行幾個簡單指令，或讓 agent 替你包裝這些指令，這個技能仍然相當實用。

可以自己自架 ai-image-generation 使用的模型嗎？

套件庫目前的證據只涵蓋透過 inference.sh 託管平台的使用方式，並未將此技能定位為自架解決方案。建議你以 inference.sh 的基礎設施與計費模式為前提來規劃。

產生圖片時遇到錯誤，要怎麼排查？

如果透過 ai-image-generation 呼叫失敗，可以依序檢查：

在終端機直接執行對應的 infsh app run ... 指令，確認是否有驗證或輸入錯誤。
用 infsh login 確認 CLI 是否已登入。
對照 inference.sh 上的文件，檢查 App ID 與 input JSON 是否正確。

若直接用 CLI 呼叫沒有問題，就調整 agent 的設定，讓它送出的參數與你在終端機測試時一致。

哪裡可以看到更多使用範例？

ai-image-generation 目錄下的 SKILL.md 內含快速上手範例與可用模型列表。若需要更深入、針對特定模型的範例（例如提示詞設計、參數說明與進階選項），可以瀏覽各個 app 的專頁與 https://inference.sh 上的相關文件。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

character-design-sheet

作者 inferen-sh

學會如何製作適用於 AI 的角色設計表，讓同一個角色在大量圖片中維持一致造型。character-design-sheet 技能會示範如何規劃角色轉向圖、表情表、色票與 LoRA 工作流程，並搭配 inference.sh CLI，用於遊戲美術、插畫、漫畫、動畫與視覺小說。

影像生成

收藏 0GitHub 0

ckm:design

作者 nextlevelbuilder

統一化的設計技能，用於品牌識別、design tokens、UI 風格設定、Logo 與 icon 產生、企業識別（CIP）情境圖、HTML 簡報、Banner，以及各大平台的社群視覺照片。

UI/UX 設計

收藏 0GitHub 0

content-repurposing

作者 inferen-sh

使用 content-repurposing，將一份長篇內容拆解成多種素材：社群貼文、threads、輪播、引言卡片等。專為內容行銷人員與創作者設計，在 inference.sh CLI 上進行 AI 協作的內容原子化。

内容行銷

收藏 0GitHub 0

agent-tools

作者 inferen-sh

agent-tools 會在你的 agent 內部提供 inference.sh CLI，讓你在同一個介面中執行超過 150 款 AI 應用：圖像生成、影片製作、LLM、搜尋、3D，以及 Twitter 自動化等。非常適合需要統一工作流程執行器、但又不想自行管理 GPU 或複雜整合，卻同時要用到 FLUX、Veo、Gemini、Grok、Claude、Seedance、OmniHuman、Tavily、Exa、OpenRouter 等多種服務的情境。

工作流自動化

收藏 0GitHub 0

ai-social-media-content

作者 inferen-sh

適用於 TikTok、Instagram、YouTube 與 X 的 AI 社群內容產生器。透過 inference.sh CLI，搭配 FLUX、Veo、Seedance、Wan、Kokoro TTS 和 Claude 等模型，一鍵生成可直接上架的平台影片、reels、shorts、縮圖、圖片、文案與 hashtags。

社交媒体

收藏 0GitHub 0

canvas-design

作者 anthropics

canvas-design 可協助代理建立原創的靜態視覺設計，輸出為 `.png` 或 `.pdf`，並以書面設計哲學與 design-first 工作流程作為核心引導。

UI 設計

收藏 0GitHub 0

background-removal

作者 inferen-sh

透過 inference.sh CLI 搭配 BiRefNet 模型，使用 background-removal 技能移除圖片背景。非常適合產品照、人像、電商商品圖片、透明 PNG 以及快速去背裁切。

影像编辑

收藏 0GitHub 232

ai-content-pipeline

作者 inferen-sh

使用 inference.sh CLI 設計並執行多步驟 AI 內容產線，把影像、影片、音訊與文字工具串在一起。透過 ai-content-pipeline，自動化以下類型的流程：產生圖片、將圖片轉成動畫影片、加入音效或旁白，最後將內容整理好，用於 YouTube、社群媒體與行銷活動。

工作流自動化

收藏 0GitHub 0