ai-content-pipeline
作者 inferen-sh使用 inference.sh CLI 设计并运行多步骤 AI 内容生产流水线,把图片、视频、音频和文本工具串联起来。通过 ai-content-pipeline,你可以自动化内容工作流,例如:生成图片、将图片动画化成视频、添加音效或配音,并为 YouTube、社交媒体和营销活动批量准备素材。
概览
什么是 ai-content-pipeline?
ai-content-pipeline 是一个用于自动化工作流的技能,帮助你通过 inference.sh CLI 构建多步骤的 AI 内容生产流水线。它专注于编排图片、视频、音频和文本相关的工具,让你可以通过可复用、可编写脚本的流程,把想法转化为最终可用的媒体内容。
常见的流程示例包括:
- 使用 FLUX 生成图片 → 用 Wan 2.5 将其动画化为视频 → 添加 Foley 音效或音乐
- 将撰写好的脚本通过 Kokoro TTS 转成语音 → 驱动 OmniHuman 虚拟人视频
- 使用搜索工具做研究 → 用 LLM 总结 → 输出适配不同社交平台或营销素材格式的内容
适合哪些人?
如果你符合以下情况,可以考虑使用 ai-content-pipeline:
- 需要生产 YouTube 或短视频,并希望自动化部分内容制作流程
- 需要创建社交媒体或营销素材,并希望使用稳定、可复用的 AI 流水线
- 习惯通过 CLI 调用图片、视频和音频模型,并希望有一个统一、串联的流程,而不是零散的单次命令
- 正在尝试各种媒体工作流,并希望看到不同 AI 工具如何串联的具体示例
它非常适合技术型创作者、增长/内容营销团队,以及围绕 inference.sh 搭建媒体自动化系统的工程师。
它解决什么问题?
ai-content-pipeline 主要用于:
- 减少手动步骤:在图片生成、视频制作、音频处理和内容分发之间打通流程
- 标准化工作流:让你可以在多条内容上复用同一条流水线
- 提供具体范式:展示如何串联 FLUX、Wan 2.5、Kokoro TTS、OmniHuman 等应用
- 充当参考实现:帮助你基于 inference.sh CLI 搭建自定义的内容生产流水线
它本身 不会 对模型进行微调,也不会取代专业后期编辑工具;它的作用是协调各类 AI 服务和媒体工具,让它们作为一条统一的流水线协同工作。
什么时候不适合使用 ai-content-pipeline?
在以下情况,你可能不需要这个技能:
- 你只想使用纯 GUI 编辑器,不打算使用终端或 CLI 工具
- 你只做单步骤生成(如一次性生成一张图片),并不需要自动化
- 你更需要对模型进行深度定制(如微调、定制训练),而不是编排工作流
如果你对基本的 CLI 使用没有问题,并且希望构建多步骤的 AI 媒体工作流(图片 → 视频 → 音频 → 内容),ai-content-pipeline 就是一个合适的选择。
使用方法
前置条件
在使用 ai-content-pipeline 之前,请确认你已经具备:
- 已安装 inference.sh CLI(
infsh)- 按照官方安装说明进行安装:
https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
- 按照官方安装说明进行安装:
- inference.sh 账号并完成登录
- 你需要在终端中使用
infsh login进行认证。
- 你需要在终端中使用
- 具备基础终端和 JSON 使用能力
- 你将通过运行
infsh app run ...命令,并传入 JSON 输入参数。
- 你将通过运行
1. 安装 ai-content-pipeline 技能
将该技能安装到你的 agent 或本地 skills 环境中:
npx skills add https://github.com/inferen-sh/skills --skill ai-content-pipeline
这会从 inferen-sh/skills 仓库中拉取 ai-content-pipeline 的定义,让你的 agent 能够引用其中的指导和工作流范式。
2. 使用 inference.sh CLI 登录
在终端中运行:
infsh login
根据提示完成认证。登录成功后,你就可以运行调用 FLUX、Wan 2.5、Kokoro TTS 等 AI 应用的流水线。
3. 运行一个简单的 图片 → 视频 流水线
该技能通过 infsh app run 命令演示核心使用模式。
仓库中的基础示例:
# Step 1: Generate an image with FLUX
infsh app run falai/flux-dev --input '{"prompt": "portrait of a woman smiling"}' > image.json
# Step 2: Animate that image into a video with Wan 2.5
infsh app run falai/wan-2-5 --input '{"image_url": "<url-from-previous>"}'
工作流说明:
- 第一条命令 使用 FLUX 生成一张图片,并将结果写入
image.json。 - 从
image.json中提取图片 URL,并填入第二条命令的image_url字段。 - 第二条命令 使用 Wan 2.5 将这张图片动画化为视频。
你可以把这套逻辑封装进自己的脚本或 agent 指令中,从而完全自动化各步骤之间的衔接。
4. 将流水线范式作为模板使用
该技能文档中提供了多个高层次的流程范式,可供你直接改造:
模式 1:Image → Video → Audio
[FLUX Image] -> [Wan 2.5 Video] -> [Foley Sound]
适用于:
- 将静态产品图片制作成短视频,并添加环境音效
- 为角色插画制作动画,用于社交媒体或宣传预告
模式 2:Script → Speech → Avatar
[LLM Script] -> [Kokoro TTS] -> [OmniHuman Avatar]
适用于:
- 将博客文章或营销文案转换为配音视频
- 生成虚拟人讲解类内容,用于社交媒体或内部培训
模式 3:Research → Content → Distribution
仓库中的示例模式(预览中略去部分细节)整体结构如下:
[Tavily Search] -> [Claude Summary/Content] -> [Channel-specific Output]
适用于:
- 使用 Tavily 等搜索工具对某个主题进行调研
- 使用 LLM(如 Claude)进行总结和内容创作
- 针对不同渠道(Twitter/X、LinkedIn、newsletter、YouTube 描述等)生成对应格式的文案
5. 集成到你自己的工作流
理解示例后,你可以进一步进行个性化集成:
- 替换工具:在
infsh app run中替换成你偏好的图片、视频或音频生成应用。 - 增加步骤:在各阶段之间插入放大(upscaling)、媒体合成或其他编辑工具(例如在动画前先对 FLUX 图片进行放大)。
- 脚本化流水线:将一系列
infsh命令写入 shell 脚本或 agent 规则中,这样可以通过单条命令或一个 prompt 触发整条流水线。 - 参数化输入:从你的 agent 或其它系统传入动态的 prompt、脚本或 URL,实现按需生成内容。
6. 查看仓库文件获取更深入的指引
在你的 skills 安装目录或直接在 GitHub 中打开:
SKILL.md– ai-content-pipeline 的核心定义和描述,包含所用工具、工作流模式和快速上手示例。guides/content/ai-content-pipeline– 针对内容工作流的补充说明和指南(该路径下可能在主仓库中包含更多支持文档或示例)。
在扩展该技能或设计自己的工作流时,可以将这些文件作为参考。
常见问题(FAQ)
安装 ai-content-pipeline 实际上会装些什么?
ai-content-pipeline 技能会从 inferen-sh/skills 仓库中安装元数据、文档以及工作流指导,让你的 agent 理解如何通过 inference.sh CLI 编排 AI 内容工作流。真正执行图片、视频、音频生成的是 infsh 以及其调用的底层 AI 应用,而不是技能本身。
使用 ai-content-pipeline 是否必须安装 inference.sh CLI?
是的。ai-content-pipeline 中的核心示例和模式都依赖 infsh CLI。请按照 cli-install.md 中的官方说明安装 CLI,然后在执行任何流水线之前运行 infsh login 完成登录。
不写代码也能用 ai-content-pipeline 吗?
你不需要编写完整的应用程序,但需要熟悉运行终端命令并能编辑基础 JSON。该技能以 CLI 使用为主,最适合能够使用 infsh app run 命令,或通过简单脚本对其进行自动化的用户。
在这些流水线中可以连接哪些 AI 工具和模型?
ai-content-pipeline 示例中提到的工具包括:
- FLUX:用于图片生成
- Wan 2.5:将图片转换为视频
- Kokoro TTS:将文本转换为语音
- OmniHuman:生成虚拟人视频
- Foley 音效及媒体合成工具:用于音频处理和素材合成
只要能够通过 infsh app run 调用,你也可以替换或扩展为 inference.sh 生态中的其他应用。
ai-content-pipeline 是否适合制作 YouTube 和社交媒体内容?
适合。仓库描述中明确提到 YouTube 视频、社交媒体内容、营销物料和自动化内容生产等使用场景。这些流水线模式非常适合制作解说视频、shorts、宣传片以及批量模板化内容。
这个技能如何帮助营销和内容运营?
ai-content-pipeline 提供的模式把调研、内容撰写、媒体生成和分发格式化串联在一起。例如,你可以:
- 用搜索工具对某个主题做调研
- 用 LLM 生成脚本或帖子
- 再转换成带配音和虚拟人的视频
- 最后针对不同社交渠道生成不同版本的文案
这样可以减少在不同工具之间反复复制粘贴的工作,帮助团队更稳定地规模化生产内容。
我可以自定义每条流水线的步骤吗?
可以。ai-content-pipeline 中的模式只是模板,而不是固定流程。你可以:
- 插入额外步骤(例如放大、字幕生成、封面图制作)
- 根据业务需求调整步骤顺序
- 替换任意单个应用,只要该应用受 inference.sh 支持即可
ai-content-pipeline 会帮我存储或管理媒体文件吗?
不会。ai-content-pipeline 只负责说明如何通过 inference.sh CLI 调用 AI 应用并在它们之间传递输出。文件的存储、资产管理和长期组织需要由你自己的环境、脚本或内容管理系统来完成。
在哪里可以查看或修改底层配置?
你可以在 inferen-sh/skills GitHub 仓库中查看该技能和相关指南,主要包括:
SKILL.md:包含 ai-content-pipeline 的定义和快速上手说明guides/content/ai-content-pipeline下的相关文件:提供扩展指引
你可以将这些示例和命令迁移到自己的仓库、脚本或 agent 规则中,以匹配你的生产环境。
