baoyu-imagine

作者 JimLiu

baoyu-imagine 是一個支援多家供應商的圖像生成 skill，提供具型別的 CLI、必要的 EXTEND.md 設定、參考圖片支援、長寬比控制，以及可在 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 與 Replicate 間執行批次產圖。

Stars13.2k

評論0

加入時間2026年4月5日

分類影像生成

安裝指令

npx skills add JimLiu/baoyu-skills --skill baoyu-imagine

編輯評分

這個 skill 的評分為 84/100，代表它是相當紮實的目錄收錄候選：代理可獲得明確的觸發條件、可實際執行的操作路徑，以及足夠的 repo 證據，能比一般泛用的圖像生成提示少掉不少猜測成本。不過，目錄使用者仍應預期第一次成功跑起來前，需先處理 Bun、各供應商憑證與偏好設定等前置準備。

84/100

亮點

觸發條件明確：frontmatter 說明清楚交代何時該使用此 skill，以及它支援的能力，包括 text-to-image、參考圖片、長寬比與批次生成。
實作內容扎實：`SKILL.md` 指向明確的可執行路徑（`scripts/main.ts`），定義了會阻擋流程的 Step 0 偏好載入機制，而 repo 也包含 21 個 scripts，以及各供應商專屬實作與測試。
安裝決策參考價值高：支援多個真實可用的供應商（OpenAI、Azure、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream、Replicate），並提供偏好設定 schema 與首次設定文件，顯示它不只是個占位用 wrapper。

注意事項

導入門檻不是一條指令就能完成：`SKILL.md` 沒有提供安裝指令，能否順利使用取決於 Bun 或 `npx bun`、供應商環境設定，以及 EXTEND.md 偏好設定是否完成。
這個 skill 功能完整，但資訊量也偏大：文件篇幅長、供應商路徑多，對只想快速跑出第一個最小範例的使用者來說，理解成本可能較高。

OpenAI Google Azure API 工作流 Batch Jobs JSON TypeScript

總覽

baoyu-imagine skill 概覽

baoyu-imagine 的功能是什麼

baoyu-imagine skill 是一套以 API 驅動的圖片生成工作流程，適合需要穩定產出圖片的 agent，而不只是提供提示詞建議。它支援多個 provider，包括 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 與 Replicate，並提供文字生圖、參考圖、長寬比、圖片尺寸與批次執行等選項。

哪些人適合安裝 baoyu-imagine skill

baoyu-imagine 特別適合想要可重用、由腳本支撐的圖片生成流程，並且希望能自由選擇 provider、保有可重現預設值的使用者。它很適合已經有 API keys 的團隊、需要比一次性聊天提示詞更高控制度的使用情境，或想根據已儲存的 prompt 檔批次生成多張圖片，而不是每次都手動重填設定的人。

為什麼使用者會選它，而不是一般提示詞

它最大的差異在於執行流程更嚴謹。這個 skill 會強制先透過 EXTEND.md 載入偏好設定，接著執行具型別的 CLI，並處理 provider 專屬邏輯、重試、輸出命名與批次控制。這讓 baoyu-imagine for Image Generation 比起單純對一般助理說一句「幫我做一張圖」更可預測，也不用賭它是否會自動選對 model 與參數。

採用前最大的限制

最大門檻在於前置設定：你需要能使用 bun 或 npx、具備 provider 憑證，並準備好有效的 EXTEND.md 偏好檔，或完成首次執行設定流程。如果你只是想偶爾在聊天 UI 裡隨手生圖，或不想自行管理 provider API 與 model 預設值，那這個 skill 就不是最適合的選擇。

如何使用 baoyu-imagine skill

baoyu-imagine 安裝情境與第一次該看的檔案

若要進行 baoyu-imagine install，請先在你的 skills 環境中，從 JimLiu/baoyu-skills repository 加入此 skill，然後優先閱讀 SKILL.md。接著最值得看的檔案是 references/config/first-time-setup.md、references/config/preferences-schema.md、scripts/main.ts 與 scripts/main.test.ts。這幾個檔案比起快速掃過整個 repository，更能直接說明卡關點所在的偏好設定步驟、config schema、CLI 參數，以及預期的執行行為。

第一次執行前必備的輸入

在真正使用 baoyu-imagine skill 前，必須先完成必要的偏好載入。這個 skill 會在專案或使用者設定位置尋找 .baoyu-skills/baoyu-imagine/EXTEND.md。實務上你需要準備：

預設 provider
該 provider 對應的預設 model
該 provider 的 API 憑證
可選的預設值，例如長寬比、品質、圖片尺寸與 batch worker 上限

缺少這些設定時，圖片生成流程應該中止並要求你先完成 setup，而不是自行猜測。

如何把 baoyu-imagine 用得好

好的 baoyu-imagine usage，起點是完整需求，而不是模糊想法。通常好的輸入會包含：

主體：a ceramic teapot on a wooden table
風格：clean product photography 或 anime concept art
構圖：three-quarter view, centered
背景：soft gray studio backdrop
輸出限制：16:9、1:1、2k 或 4K
參考資料：若需要一致性，可提供一張或多張圖片路徑

像「draw a teapot」這種目標就太弱。更有力的寫法會是：「Generate a 1:1 hero image of a matte white ceramic teapot, minimal studio lighting, soft shadow, premium ecommerce style, no text, no extra props.」這樣 provider 在第一次生成時，就比較有足夠結構產出可用結果。

實務工作流程與批次建議

探索階段建議使用單張、依序生成；當 prompt 已經定稿，再切換到 batch mode。程式碼本身支援 promptFiles、referenceImages、batchFile 與 jobs，也內建 provider rate limit 的處理。實務上可參考這份 baoyu-imagine guide：

先在 EXTEND.md 設好預設值。
用單一 provider 測試一個 prompt。
再補上長寬比與圖片尺寸限制。
只有在需要一致性時，才加入參考圖。
確定概念方向後，再改用 batch 檔批次生成。

這樣的流程可以避免把 tokens 浪費在低品質、平行產生的大量草稿上。

baoyu-imagine skill 常見問題

baoyu-imagine 適合新手嗎？

適合，前提是你對 API keys 與 config 檔案不排斥。這個 skill 結構清楚、有測試，且 setup 步驟寫得很明白，能幫助新手避開隱藏的預設行為。但它不是「零設定」工具；由於有強制性的 EXTEND.md 步驟，第一次使用前仍需要花幾分鐘完成設定。

什麼情況下 baoyu-imagine 比一般聊天提示詞更適合？

當你需要 provider 控制、可重現結果、已儲存偏好、參考圖支援，或批次生成能力時，就該用 baoyu-imagine。如果只是隨手試玩，一般 prompt 已經夠用。當產出品質仰賴一致的 model、尺寸與可重複使用的工作流程設定時，baoyu-imagine skill 會明顯更合適。

baoyu-imagine 對多個圖片 provider 的支援做得好嗎？

有，而且做得相當完整。repository 內針對 Azure、OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 與 Replicate，都有獨立的 provider modules 與測試。這點很重要，因為不同 provider 的行為與參數驗證方式並不相同。這個 skill 的結構能降低你在切換 provider 或排查環境問題時反覆試錯的成本。

什麼情況不該安裝 baoyu-imagine？

如果你只是偶爾在託管式聊天 app 裡生圖、不想管理憑證，或根本不需要 batch 檔與結構化預設值，那就可以略過 baoyu-imagine install。另外，如果你的流程重度依賴人工逐步修圖，而不是以 prompt 為核心的圖片生成，這個 skill 也不太適合。

如何改進 baoyu-imagine skill 的使用效果

為 baoyu-imagine 提供更完整的創作限制

想提升 baoyu-imagine for Image Generation 的成果，最快的方法就是一開始就把意圖、取景與排除條件講清楚。請明確寫出媒材、光線、鏡頭角度、氛圍，以及不要出現什麼。如果你希望多張圖維持一致，就把那些不可變動的屬性逐次完整重述，不要每次換句話說。

有選擇地使用參考圖

參考圖在對齊角色辨識度、產品外形、色盤或構圖時很有幫助，但也可能把結果鎖得太死。建議先從一張清楚的參考圖開始，再考慮是否加入更多。如果輸出開始變得僵硬或過度接近原圖，就移除影響較弱的參考圖，改為強化文字 brief。

在第一輪輸出後修正常見失敗模式

如果第一張已經接近，但還是有誤，請一次只改一個變數：

構圖不對：重寫取景方式與鏡頭角度
風格不對：更直接點名目標風格
比例不對：補上主體尺度與版面配置線索
太過普通：加入材質、年代、環境與情緒
batch 結果不穩：降低 jobs，或固定 provider/model 不變

這通常比從頭整段重寫 prompt 更有效。

依實際工作量調整 config 與吞吐量

如果是重複性的 baoyu-imagine usage，請優先把預設值整理到 EXTEND.md，而不是每次重新敘述。把預設 provider、預設 model 與常用長寬比一次設定好。若是 batch 工作負載，請檢查 references/config/preferences-schema.md 裡的 batch.max_workers 與 provider_limits；平行度開太高，往往會比速度提升更早拖垮穩定性。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

openclaw-persona-forge

作者 affaan-m

openclaw-persona-forge 是一個以工作流程為核心的技能，可從零開始建立完整的 OpenClaw 人設套件。它會產出身份張力、SOUL.md 風格框架、邊界規則、命名選項，以及可選的頭像提示詞指引。最適合 OpenClaw 角色設計、角色扮演代理，以及與 UI Design 相鄰的人設工作，不適合拿來對既有人設做小幅修改。

UI 設計

收藏 0GitHub 156.2k

baoyu-comic

作者 JimLiu

baoyu-comic 是一項可將來源文字轉成教育漫畫或傳記風格漫畫的技能，涵蓋分鏡規劃、角色一致性、分格版面配置，以及分階段圖像生成。它支援可安裝的 CLI 用法，提供風格與版面選項，也支援如 `--storyboard-only`、`--prompts-only` 與 `--regenerate` 等局部工作流，讓漫畫製作過程更可控。

影像生成

收藏 0GitHub 13.2k

shader-dev

作者 MiniMax-AI

shader-dev 是一套實用的 GLSL 著色器技能，適用於 ShaderToy 風格的即時視覺效果。使用 shader-dev 技能可建立或除錯 ray marching、SDF 場景、光照、粒子、流體動態、後製，以及 UI Design 的 shader-dev，且比泛用提示詞更少憑空猜測。

UI 設計

收藏 0GitHub 11.7k

videoagent-video-studio

作者 pexoai

videoagent-video-studio 是一個可依文字、圖片與參考素材生成短篇 AI 影片的技能。可用來測試 text-to-video 與 image-to-video 工作流程、比較支援模型，並以 Node 18+ 執行代管 proxy 或自行部署的 self-hosted 設定。

视频编辑

收藏 0GitHub 456

seo-image-gen

作者 AgriciDaniel

seo-image-gen 是一個 GitHub skill，可將 SEO 圖像需求轉化為可直接上線使用的提示詞與設定，適用於 OG 圖、社群預覽、Hero 橫幅、產品視覺、資訊圖表與縮圖。它透過 nanobanana-mcp 使用 Gemini，並假設已安裝 banana extension，提供一份實用的 seo-image-gen 使用指南與工作流程。

影像生成

收藏 0GitHub 0

baoyu-xhs-images

作者 JimLiu

baoyu-xhs-images 可將文章或筆記轉成小紅書資訊圖卡輪播，提供預設、風格、版型與設定指引。它能幫助使用者安裝技能、選擇合適輸入內容，並執行 `/baoyu-xhs-images` 來產出結構化的多頁社群貼文。

UI 設計

收藏 0GitHub 13.2k

baoyu-cover-image

作者 JimLiu

baoyu-cover-image 可協助代理生成結構化的文章封面圖片提示詞，涵蓋類型、配色、渲染、文字與氛圍等維度。支援 2.35:1、16:9 與 1:1 格式，並提供自動選擇規則與相容性指引，適合需要可重複執行的編輯與 UI Design 封面製作流程。

UI 設計

收藏 0GitHub 13.2k

meme-factory

作者 softaworks

meme-factory 可協助代理透過免費的 memegen.link API 製作模板式迷因，也支援對 Markdown 友善的文字迷因。你可以用它產生適合分享的迷因 URL、挑選合適模板、正確處理文字格式，並透過內附的 Python helper 自動化輸出。

影像生成

收藏 0GitHub 1.3k

logo-creator

作者 ReScienceLab

logo-creator 是一套用於 AI 標誌製作的工作流程，支援產生概念稿、比較不同版本、裁切、去背，以及匯出 SVG 素材。它結合風格參考、範例提示詞與輔助腳本，可在 ReScienceLab/opc-skills 中用於建立 logo、icon、favicon 與品牌標記。

品牌設計

收藏 0GitHub 0

scientific-schematics

作者 K-Dense-AI

scientific-schematics 可將自然語言提示詞轉成可達到出版等級的科學圖表，並透過智慧型迭代精修持續提升成品。它以 Nano Banana 2 進行生成，並使用 Gemini 3.1 Pro Preview 進行審查；只有當輸出低於你文件類型所需門檻時才會重新生成。這套流程特別適合神經網路架構、系統圖、流程圖、生物路徑，以及其他複雜的科學視覺化內容。

影像生成

收藏 0GitHub 0

banner-creator

作者 ReScienceLab

banner-creator 透過結構化流程協助製作橫幅、頁首圖與 hero images：先蒐集需求、產生多個版本、依回饋細修，再用內附腳本裁切成各平台所需比例。

UI 設計

收藏 0GitHub 0

baoyu-article-illustrator

作者 JimLiu

baoyu-article-illustrator 可協助代理將文章草稿轉成結構化的插圖提示、插圖放置位置，以及一致的圖像類型與風格選擇，適合用於解說文、教學內容、圖解與多圖文章。

影像生成

收藏 0GitHub 13.2k

nanobanana

作者 ReScienceLab

nanobanana 是一個用於 Google Gemini 3 Pro Image 的 Python CLI skill，支援文生圖、圖片編輯、長寬比設定、2K/4K 輸出，以及透過簡單本機腳本進行批次生成。

影像生成

收藏 0GitHub 654

sound-fx

作者 NoizAI

使用 sound-fx 技能把文字提示轉成音效、擬音、環境底音、怪物聲，以及 UI 音效。它很適合 Audio Editing 的 sound-fx、快速原型製作與可下載的音訊素材。先用 NoizAI/skills 安裝，再透過腳本式工作流程搭配有效的 Noiz API key 使用。**不適用於**語音、歌詞、旋律或聲音複製。

音频编辑

收藏 0GitHub 498

chat-with-anyone

作者 NoizAI

chat-with-anyone 可讓你從公開音訊複製真實人物的聲音，或根據圖片設計相符的聲音，接著用 TTS 生成合成回覆。它支援角色扮演、敘事與語音生成等實用工作流程，並提供安裝、來源選擇與安全使用的指引。

語音生成

收藏 0GitHub 498

videoagent-image-studio

作者 pexoai

videoagent-image-studio 是為 Node 型代理設計的統一圖片生成技能。它以單一 CLI 流程整合 Midjourney、Flux、Ideogram、Recraft、SDXL 等模型，提供代理支援的設定方式、模型選用指引，以及適合自動化流程的標準化輸出。

影像生成

收藏 0GitHub 456