baoyu-imagine

作者 JimLiu

baoyu-imagine 是一款支持多家服务商的图像生成技能，提供类型化 CLI、必需的 EXTEND.md 配置、参考图支持、宽高比控制，以及可在 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 和 Replicate 之间进行批量运行。

Stars13.2k

收录时间2026年4月5日

分类图像生成

安装命令

npx skills add JimLiu/baoyu-skills --skill baoyu-imagine

编辑评分

该技能评分为 84/100，说明它是一个质量扎实、适合收录到目录中的候选项：agent 能获得清晰的触发场景、真实可执行的运行路径，以及足够的仓库证据，相比泛泛的图像生成提示词，实际使用时需要的猜测明显更少。不过，目录用户仍应预期首次成功运行前会有一定配置成本，包括 Bun、各 provider 凭证以及偏好设置。

84/100

亮点

触发条件清晰：frontmatter 描述明确说明了何时使用，以及支持哪些能力，包括文生图、参考图、宽高比和批量生成。
可操作性很强：`SKILL.md` 指向了明确的可执行路径（`scripts/main.ts`），定义了会阻塞执行的 Step 0 偏好加载流程，仓库中还包含 21 个脚本，以及按 provider 划分的实现与测试。
安装决策参考价值高：支持多个真实 provider（OpenAI、Azure、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream、Replicate），并提供偏好 schema 和首次配置文档，说明它不只是一个占位式封装。

注意点

上手并非一条命令就能完成：`SKILL.md` 没有提供安装命令，能否顺利用起来取决于 Bun 或 `npx bun`、provider 环境配置，以及 EXTEND.md 中的偏好设置。
技能能力很完整，但内容也较为密集：文档较长、provider 路径较多，对于只想快速跑通最小示例的用户来说，理解成本可能偏高。

OpenAI Google Azure API 工作流 Batch Jobs JSON TypeScript

概览

baoyu-imagine skill 概览

baoyu-imagine 能做什么

baoyu-imagine skill 是一套通过 API 驱动的图像生成工作流，适合那些需要稳定产出图片、而不只是让助手“给几个提示词”的 agent 使用。它支持多个 provider，包括 OpenAI、Azure OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 和 Replicate，并提供 text-to-image、参考图、宽高比、图片尺寸以及批量运行等能力。

谁适合安装 baoyu-imagine skill

如果你想要一个可复用、由脚本驱动的图像生成流水线，并且希望能自由选择 provider、固定默认参数、重复执行同类任务，那么 baoyu-imagine 很适合你。它尤其适合已经有 API key、需要比一次性聊天提示更高控制力的团队，或者希望基于保存好的 prompt 文件批量生成多张图片、而不是每次手动重填设置的用户。

为什么用户会选它，而不是普通提示词

它最核心的差异在于执行流程足够严谨。这个 skill 会强制先通过 EXTEND.md 加载偏好设置，然后再运行带类型约束的 CLI，同时处理 provider-specific 行为、重试机制、输出命名和批量控制。也正因为如此，baoyu-imagine for Image Generation 相比直接对通用助手说一句“帮我生成一张图”，在模型选择、参数控制和结果稳定性上都更可预测。

采用它前最大的限制是什么

最大的门槛在于初始化配置：你需要能使用 bun 或 npx，准备好 provider 凭证，并提供有效的 EXTEND.md 偏好文件，或者完成首次运行的初始化流程。如果你只是偶尔在聊天界面里随手生成一张图，或者并不想自己管理 provider API 和模型默认值，那它就不是最合适的选择。

如何使用 baoyu-imagine skill

安装后先看什么，哪些文件最关键

如果你要进行 baoyu-imagine install，需要先从 JimLiu/baoyu-skills 仓库把这个 skill 加到你的 skills 环境里，然后优先阅读 SKILL.md。接下来最值得看的文件是 references/config/first-time-setup.md、references/config/preferences-schema.md、scripts/main.ts 和 scripts/main.test.ts。相比快速扫一遍仓库，这几处更能直接说明强制偏好加载这一步、配置 schema、CLI 参数，以及实际执行行为分别是怎么设计的。

第一次运行前必须准备的输入

在真正使用 baoyu-imagine skill 之前，你必须先完成必需的偏好加载。这个 skill 会在项目级或用户级配置路径中查找 .baoyu-skills/baoyu-imagine/EXTEND.md。实际需要准备的内容包括：

默认 provider
该 provider 对应的默认模型
这个 provider 的 API 凭证
可选默认项，例如宽高比、质量、图片尺寸和批处理 worker 限制

如果这些信息不存在，图像生成流程就应该中止并提示你先完成设置，而不是自行猜测参数。

怎样调用 baoyu-imagine，效果更好

高质量的 baoyu-imagine usage 往往始于一个完整明确的请求，而不是一句模糊想法。好的输入通常会包含：

subject：“a ceramic teapot on a wooden table”
style：“clean product photography” 或 “anime concept art”
composition：“three-quarter view, centered”
background：“soft gray studio backdrop”
output constraints：16:9、1:1、2k 或 4K
references：如果你在意一致性，可提供一个或多个图片路径

“draw a teapot” 这种目标就偏弱。更强的写法是：“Generate a 1:1 hero image of a matte white ceramic teapot, minimal studio lighting, soft shadow, premium ecommerce style, no text, no extra props.” 这样 provider 在第一次生成时就更有机会产出可直接使用的结果。

实际工作流与批量生成建议

探索阶段建议用单图、串行生成；当 prompt 已经定稿，再切换到 batch mode。代码层面已经支持 promptFiles、referenceImages、batchFile 和 jobs，同时内置了 provider 的速率限制控制。一个实用的 baoyu-imagine guide 可以这样走：

先在 EXTEND.md 里设好默认值。
先用一个 provider 测试一条 prompt。
再补充宽高比和图片尺寸约束。
只有在确实需要一致性时，再加入参考图。
当你要批量生成一组已经确认过方向的概念图时，再切换到 batch file。

这个流程能避免你把 token 浪费在大量并行但质量并不高的草稿上。

baoyu-imagine skill 常见问题

baoyu-imagine 适合新手吗？

适合，前提是你对 API key 和配置文件不陌生。这个 skill 的结构清晰、测试完善，而且初始化要求写得比较明确，能帮助新手避开那些“看不见的默认值”带来的问题。但它并不是“零配置”工具；强制性的 EXTEND.md 步骤意味着第一次使用前，你还是要花几分钟把基础设置补齐。

什么情况下，baoyu-imagine 比普通聊天提示更合适？

当你需要精确控制 provider、保证结果可复现、保存偏好设置、使用参考图，或者进行批量生成时，就应该优先用 baoyu-imagine。普通聊天提示更适合轻量、随手的尝试；而当输出质量依赖于稳定的模型选择、尺寸参数和可复用工作流设置时，baoyu-imagine skill 会更合适。

baoyu-imagine 对多 provider 支持得好吗？

支持得比较扎实。仓库里为 Azure、OpenAI、Google、OpenRouter、DashScope、MiniMax、Jimeng、Seedream 和 Replicate 分别提供了独立的 provider 模块和测试。这一点很重要，因为不同 provider 的行为细节和参数校验方式并不一致。这样的结构能明显减少你在切换 provider 或排查环境问题时的反复试错成本。

什么情况下不建议安装 baoyu-imagine？

如果你只是在托管聊天应用里偶尔生成图片、不想管理凭证，或者根本不需要 batch file 和结构化默认值，那就可以跳过 baoyu-imagine install。另外，如果你的工作流主要依赖大量手工视觉编辑，而不是以 prompt 驱动生成为核心，这个 skill 也不会特别契合。

如何改进 baoyu-imagine skill 的使用效果

给 baoyu-imagine 提供更丰富的创作约束

想提升 baoyu-imagine for Image Generation 的结果质量，最快的方法就是一开始就把意图、构图和排除项说清楚。尽量补充媒介、光线、镜头角度、情绪氛围，以及明确不要出现什么。如果你希望多张图保持一致，就把那些不能变的属性逐次原样重复，而不要每轮都换一种说法去意译。

有选择地使用参考图

参考图在需要对齐角色身份、产品外形、配色或构图时非常有帮助，但也可能把结果限制得过死。建议先从一张清晰、信息明确的参考图开始，而不是一上来塞很多张。如果生成结果开始显得僵硬、或者过于像参考图本身，就删掉较弱的参考图，把文字 brief 写得更强一些。

拿到第一张结果后，针对常见问题逐项修正

如果第一张图已经接近目标，但仍有偏差，最好一次只改一个变量：

构图不对：重写 framing 和 camera angle
风格不对：更直接地点名目标风格
比例不对：补充主体尺度和布局提示
过于泛泛：加入材质、年代、环境和情绪
batch 结果不稳定：降低 jobs，或固定 provider/model 不变

通常这样做，比把整段 prompt 从头推翻重写更有效。

面向真实负载，调整配置与吞吐

如果你会反复进行 baoyu-imagine usage，更好的做法是把常用默认值直接优化到 EXTEND.md 里，而不是每次都在 prompt 里重复一遍。把默认 provider、默认模型和偏好的宽高比一次设好。对于批量任务，则要查看 references/config/preferences-schema.md 里的 batch.max_workers 和 provider_limits；并发开得太激进，往往会比提速更快地先伤害稳定性。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

openclaw-persona-forge

作者 affaan-m

openclaw-persona-forge 是一款以工作流驱动的技能，用于从零开始构建完整的 OpenClaw persona 套件。它会生成身份张力、SOUL.md 风格框架、边界规则、名字备选，以及可选的头像 prompt 指引。适合 OpenClaw 角色设计、roleplay agents 和偏 UI Design 的 persona 工作，不适合对现有 persona 做小幅修改。

UI 设计

收藏 0GitHub 156.2k

baoyu-comic

作者 JimLiu

baoyu-comic 是一项可将源文本转成教育类或传记风格漫画的技能，覆盖分镜规划、角色一致性、分格布局以及分阶段图像生成。它支持可安装的 CLI 用法，提供风格与版式选项，也支持 `--storyboard-only`、`--prompts-only`、`--regenerate` 等局部流程，便于更可控地完成漫画生产。

图像生成

收藏 0GitHub 13.2k

shader-dev

作者 MiniMax-AI

shader-dev 是一个面向 ShaderToy 风格实时视觉效果的实用 GLSL 着色器技能。使用 shader-dev 技能可以更少靠猜测地构建或调试 ray marching、SDF 场景、光照、粒子、流体运动、后期处理，以及用于 UI Design 的 shader-dev。

UI 设计

收藏 0GitHub 11.7k

videoagent-video-studio

作者 pexoai

videoagent-video-studio 是一款可根据文本、图片和参考素材生成短篇 AI 视频的技能。你可以用它测试 text-to-video 与 image-to-video 工作流，对比支持的模型，并在 Node 18+ 环境下使用托管代理或自托管方案运行。

视频编辑

收藏 0GitHub 456

seo-image-gen

作者 AgriciDaniel

seo-image-gen 是一个 GitHub skill，用于把 SEO 图片需求转化为可直接用于生产的 prompts 和设置，覆盖 OG images、社交预览图、hero banners、产品视觉图、信息图和 thumbnails。它通过 nanobanana-mcp 调用 Gemini，并默认已安装 banana extension，适合用作一份实用的 seo-image-gen 安装与工作流指南。

图像生成

收藏 0GitHub 0

baoyu-xhs-images

作者 JimLiu

baoyu-xhs-images 可将文章或笔记转换成小红书信息图轮播，提供预设、风格、版式与配置指引，帮助用户完成安装、选择输入内容，并运行 `/baoyu-xhs-images` 生成结构化的多页社交内容。

UI 设计

收藏 0GitHub 13.2k

baoyu-cover-image

作者 JimLiu

baoyu-cover-image 帮助 agent 按类型、配色、渲染、文字和氛围等维度，生成结构化的文章封面图提示词。它支持 2.35:1、16:9 和 1:1 格式，内置自动选择规则与兼容性说明，适合可重复执行的 editorial 和 UI Design 封面工作流。

UI 设计

收藏 0GitHub 13.2k

meme-factory

作者 softaworks

meme-factory 可帮助 agent 基于模板生成 meme，调用免费的 memegen.link API，也支持适合 Markdown 的文字类 meme。你可以用它生成可分享的 meme URL、选择合适模板、正确格式化文本，并借助随附的 Python helper 自动化输出。

图像生成

收藏 0GitHub 1.3k

logo-creator

作者 ReScienceLab

logo-creator 是一套面向 AI logo 设计的工作流，可用于生成创意方向、对比不同变体、裁剪图像、移除背景并导出 SVG 资产。它结合风格参考、示例提示词和辅助脚本，在 ReScienceLab/opc-skills 中支持 logo、icon、favicon 和品牌标记的创建。

品牌设计

收藏 0GitHub 0

scientific-schematics

作者 K-Dense-AI

scientific-schematics 可将自然语言提示转化为适合发表的科学图表，并通过智能迭代优化持续提升质量。它使用 Nano Banana 2 生成图像，并用 Gemini 3.1 Pro Preview 进行审阅；只有当输出低于你的文档类型阈值时才会重新生成。适用于神经网络架构、系统示意图、流程图、生物通路及其他复杂科学可视化内容。

图像生成

收藏 0GitHub 0

banner-creator

作者 ReScienceLab

banner-creator 提供结构化流程，帮助创建横幅、页眉和 hero 图片：先收集需求，再生成多个方案，结合反馈迭代优化，并使用自带脚本按平台比例裁切。

UI 设计

收藏 0GitHub 0

baoyu-article-illustrator

作者 JimLiu

baoyu-article-illustrator 可帮助 agent 将文章草稿转成结构化插图提示词、插入位置建议，以及统一的题材与风格决策，适用于解读型内容、教程、图解和多图文章。

图像生成

收藏 0GitHub 13.2k

nanobanana

作者 ReScienceLab

nanobanana 是一款面向 Google Gemini 3 Pro Image 的 Python CLI 技能，支持文生图、图像编辑、宽高比设置、2K/4K 输出，以及通过简单本地脚本进行批量生成。

图像生成

收藏 0GitHub 654

sound-fx

作者 NoizAI

使用 sound-fx 技能，把文本提示词转换成音效、拟音、环境底噪、怪物声音和 UI 音效。它适合用于音效编辑、快速原型验证和可下载音频素材制作。先通过 NoizAI/skills 安装，然后使用基于脚本的工作流，并准备有效的 Noiz API key。它不适用于语音、歌词、旋律或声音克隆。

音频编辑

收藏 0GitHub 498

chat-with-anyone

作者 NoizAI

chat-with-anyone 可从公开音频克隆真实人物的声音，或根据图片设计匹配的声音，再通过 TTS 生成合成回复。它支持角色扮演、旁白和语音生成等实用工作流，并提供安装、素材选择和安全使用方面的指导。

语音生成

收藏 0GitHub 498

videoagent-image-studio

作者 pexoai

videoagent-image-studio 是一款面向 Node agent 的统一图像生成技能。它为 Midjourney、Flux、Ideogram、Recraft、SDXL 等模型提供单一 CLI 工作流，并具备基于代理的配置、模型选择指引和适合自动化的标准化输出。

图像生成

收藏 0GitHub 456