ai-content-pipeline

作者 inferen-sh

使用 inference.sh CLI 设计并运行多步骤 AI 内容生产流水线，把图片、视频、音频和文本工具串联起来。通过 ai-content-pipeline，你可以自动化内容工作流，例如：生成图片、将图片动画化成视频、添加音效或配音，并为 YouTube、社交媒体和营销活动批量准备素材。

Stars0

收录时间2026年3月27日

分类工作流自动化

安装命令

npx skills add https://github.com/inferen-sh/skills --skill ai-content-pipeline

Cli 工作流 Automation 视频音频 Social Media Marketing

概览

什么是 ai-content-pipeline？

ai-content-pipeline 是一个用于自动化工作流的技能，帮助你通过 inference.sh CLI 构建多步骤的 AI 内容生产流水线。它专注于编排图片、视频、音频和文本相关的工具，让你可以通过可复用、可编写脚本的流程，把想法转化为最终可用的媒体内容。

常见的流程示例包括：

使用 FLUX 生成图片 → 用 Wan 2.5 将其动画化为视频 → 添加 Foley 音效或音乐
将撰写好的脚本通过 Kokoro TTS 转成语音 → 驱动 OmniHuman 虚拟人视频
使用搜索工具做研究 → 用 LLM 总结 → 输出适配不同社交平台或营销素材格式的内容

适合哪些人？

如果你符合以下情况，可以考虑使用 ai-content-pipeline：

需要生产 YouTube 或短视频，并希望自动化部分内容制作流程
需要创建社交媒体或营销素材，并希望使用稳定、可复用的 AI 流水线
习惯通过 CLI 调用图片、视频和音频模型，并希望有一个统一、串联的流程，而不是零散的单次命令
正在尝试各种媒体工作流，并希望看到不同 AI 工具如何串联的具体示例

它非常适合技术型创作者、增长/内容营销团队，以及围绕 inference.sh 搭建媒体自动化系统的工程师。

它解决什么问题？

ai-content-pipeline 主要用于：

减少手动步骤：在图片生成、视频制作、音频处理和内容分发之间打通流程
标准化工作流：让你可以在多条内容上复用同一条流水线
提供具体范式：展示如何串联 FLUX、Wan 2.5、Kokoro TTS、OmniHuman 等应用
充当参考实现：帮助你基于 inference.sh CLI 搭建自定义的内容生产流水线

它本身不会对模型进行微调，也不会取代专业后期编辑工具；它的作用是协调各类 AI 服务和媒体工具，让它们作为一条统一的流水线协同工作。

什么时候不适合使用 ai-content-pipeline？

在以下情况，你可能不需要这个技能：

你只想使用纯 GUI 编辑器，不打算使用终端或 CLI 工具
你只做单步骤生成（如一次性生成一张图片），并不需要自动化
你更需要对模型进行深度定制（如微调、定制训练），而不是编排工作流

如果你对基本的 CLI 使用没有问题，并且希望构建多步骤的 AI 媒体工作流（图片 → 视频 → 音频 → 内容），ai-content-pipeline 就是一个合适的选择。

使用方法

前置条件

在使用 ai-content-pipeline 之前，请确认你已经具备：

已安装 inference.sh CLI（infsh）
- 按照官方安装说明进行安装：https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
inference.sh 账号并完成登录
- 你需要在终端中使用 infsh login 进行认证。
具备基础终端和 JSON 使用能力
- 你将通过运行 infsh app run ... 命令，并传入 JSON 输入参数。

1. 安装 ai-content-pipeline 技能

将该技能安装到你的 agent 或本地 skills 环境中：

npx skills add https://github.com/inferen-sh/skills --skill ai-content-pipeline

这会从 inferen-sh/skills 仓库中拉取 ai-content-pipeline 的定义，让你的 agent 能够引用其中的指导和工作流范式。

2. 使用 inference.sh CLI 登录

在终端中运行：

infsh login

根据提示完成认证。登录成功后，你就可以运行调用 FLUX、Wan 2.5、Kokoro TTS 等 AI 应用的流水线。

3. 运行一个简单的图片 → 视频流水线

该技能通过 infsh app run 命令演示核心使用模式。

仓库中的基础示例：

# Step 1: Generate an image with FLUX
infsh app run falai/flux-dev --input '{"prompt": "portrait of a woman smiling"}' > image.json

# Step 2: Animate that image into a video with Wan 2.5
infsh app run falai/wan-2-5 --input '{"image_url": "<url-from-previous>"}'

工作流说明：

第一条命令 使用 FLUX 生成一张图片，并将结果写入 image.json。
从 image.json 中提取图片 URL，并填入第二条命令的 image_url 字段。
第二条命令 使用 Wan 2.5 将这张图片动画化为视频。

你可以把这套逻辑封装进自己的脚本或 agent 指令中，从而完全自动化各步骤之间的衔接。

4. 将流水线范式作为模板使用

该技能文档中提供了多个高层次的流程范式，可供你直接改造：

模式 1：Image → Video → Audio

[FLUX Image] -> [Wan 2.5 Video] -> [Foley Sound]

适用于：

将静态产品图片制作成短视频，并添加环境音效
为角色插画制作动画，用于社交媒体或宣传预告

模式 2：Script → Speech → Avatar

[LLM Script] -> [Kokoro TTS] -> [OmniHuman Avatar]

适用于：

将博客文章或营销文案转换为配音视频
生成虚拟人讲解类内容，用于社交媒体或内部培训

模式 3：Research → Content → Distribution

仓库中的示例模式（预览中略去部分细节）整体结构如下：

[Tavily Search] -> [Claude Summary/Content] -> [Channel-specific Output]

适用于：

使用 Tavily 等搜索工具对某个主题进行调研
使用 LLM（如 Claude）进行总结和内容创作
针对不同渠道（Twitter/X、LinkedIn、newsletter、YouTube 描述等）生成对应格式的文案

5. 集成到你自己的工作流

理解示例后，你可以进一步进行个性化集成：

替换工具：在 infsh app run 中替换成你偏好的图片、视频或音频生成应用。
增加步骤：在各阶段之间插入放大（upscaling）、媒体合成或其他编辑工具（例如在动画前先对 FLUX 图片进行放大）。
脚本化流水线：将一系列 infsh 命令写入 shell 脚本或 agent 规则中，这样可以通过单条命令或一个 prompt 触发整条流水线。
参数化输入：从你的 agent 或其它系统传入动态的 prompt、脚本或 URL，实现按需生成内容。

6. 查看仓库文件获取更深入的指引

在你的 skills 安装目录或直接在 GitHub 中打开：

SKILL.md – ai-content-pipeline 的核心定义和描述，包含所用工具、工作流模式和快速上手示例。
guides/content/ai-content-pipeline – 针对内容工作流的补充说明和指南（该路径下可能在主仓库中包含更多支持文档或示例）。

在扩展该技能或设计自己的工作流时，可以将这些文件作为参考。

常见问题（FAQ）

安装 ai-content-pipeline 实际上会装些什么？

ai-content-pipeline 技能会从 inferen-sh/skills 仓库中安装元数据、文档以及工作流指导，让你的 agent 理解如何通过 inference.sh CLI 编排 AI 内容工作流。真正执行图片、视频、音频生成的是 infsh 以及其调用的底层 AI 应用，而不是技能本身。

使用 ai-content-pipeline 是否必须安装 inference.sh CLI？

是的。ai-content-pipeline 中的核心示例和模式都依赖 infsh CLI。请按照 cli-install.md 中的官方说明安装 CLI，然后在执行任何流水线之前运行 infsh login 完成登录。

不写代码也能用 ai-content-pipeline 吗？

你不需要编写完整的应用程序，但需要熟悉运行终端命令并能编辑基础 JSON。该技能以 CLI 使用为主，最适合能够使用 infsh app run 命令，或通过简单脚本对其进行自动化的用户。

在这些流水线中可以连接哪些 AI 工具和模型？

ai-content-pipeline 示例中提到的工具包括：

FLUX：用于图片生成
Wan 2.5：将图片转换为视频
Kokoro TTS：将文本转换为语音
OmniHuman：生成虚拟人视频
Foley 音效及媒体合成工具：用于音频处理和素材合成

只要能够通过 infsh app run 调用，你也可以替换或扩展为 inference.sh 生态中的其他应用。

ai-content-pipeline 是否适合制作 YouTube 和社交媒体内容？

适合。仓库描述中明确提到 YouTube 视频、社交媒体内容、营销物料和自动化内容生产等使用场景。这些流水线模式非常适合制作解说视频、shorts、宣传片以及批量模板化内容。

这个技能如何帮助营销和内容运营？

ai-content-pipeline 提供的模式把调研、内容撰写、媒体生成和分发格式化串联在一起。例如，你可以：

用搜索工具对某个主题做调研
用 LLM 生成脚本或帖子
再转换成带配音和虚拟人的视频
最后针对不同社交渠道生成不同版本的文案

这样可以减少在不同工具之间反复复制粘贴的工作，帮助团队更稳定地规模化生产内容。

我可以自定义每条流水线的步骤吗？

可以。ai-content-pipeline 中的模式只是模板，而不是固定流程。你可以：

插入额外步骤（例如放大、字幕生成、封面图制作）
根据业务需求调整步骤顺序
替换任意单个应用，只要该应用受 inference.sh 支持即可

ai-content-pipeline 会帮我存储或管理媒体文件吗？

不会。ai-content-pipeline 只负责说明如何通过 inference.sh CLI 调用 AI 应用并在它们之间传递输出。文件的存储、资产管理和长期组织需要由你自己的环境、脚本或内容管理系统来完成。

在哪里可以查看或修改底层配置？

你可以在 inferen-sh/skills GitHub 仓库中查看该技能和相关指南，主要包括：

SKILL.md：包含 ai-content-pipeline 的定义和快速上手说明
guides/content/ai-content-pipeline 下的相关文件：提供扩展指引

你可以将这些示例和命令迁移到自己的仓库、脚本或 agent 规则中，以匹配你的生产环境。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

ai-automation-workflows

作者 inferen-sh

安装 ai-automation-workflows，结合 inference.sh CLI 搭建自动化 AI 工作流。学习批量任务、定时任务、事件驱动流水线，以及用于内容生成、数据处理和大规模监控的 agent 风格循环。

工作流自动化

收藏 0GitHub 0

executing-plans

作者 obra

使用 executing-plans 技能加载一份书面的实现计划，对其进行审慎评审，并按步骤执行小颗粒度的开发任务，同时带有检查点与状态跟踪。

项目管理

收藏 0GitHub 0

agent-browser

作者 inferen-sh

agent-browser 让 AI agent 能通过 inference.sh 控制一个由 Playwright 驱动的浏览器。它可以打开页面，使用 @e 元素引用进行点击、输入、拖拽、上传文件、抓取内容，并截取截图或录制视频。非常适合 Web 自动化、数据抽取和由 agent 驱动的浏览流程。

浏览器自动化

收藏 0GitHub 0

agent-browser

作者 vercel-labs

agent-browser 是为 AI agents 和 shell 脚本设计的 Chrome/Chromium 浏览器自动化 CLI。你可以用它打开页面、导航、点击、填写表单、抓取快照、截图、录屏、性能 profiling、管理会话、处理认证流程，以及自动化端到端浏览器操作流程。

浏览器自动化

收藏 0GitHub 0

dispatching-parallel-agents

作者 obra

设计并并行运行多个相互独立的 AI agents，每个都有各自聚焦的上下文和任务域。

Agent 编排

收藏 0GitHub 0

verification-before-completion

作者 obra

强制执行一条严格规则：在你运行过实际的验证命令、检查其输出，并基于最新证据得出结论之前，绝不能宣称任何工作已完成、问题已修复或检查已通过。

测试自动化

收藏 0GitHub 0

ai-avatar-video

作者 inferen-sh

使用 inference.sh CLI，根据图片和音频生成 AI 虚拟人和说话头像视频。ai-avatar-video 封装了 OmniHuman、Fabric 和 PixVerse Lipsync 等应用，用于打造音频驱动的虚拟人、唇形同步视频和虚拟主持人，非常适合营销、讲解视频和社交内容工作流。

视频编辑

收藏 0GitHub 0

microsoft-foundry

作者 microsoft

端到端指导你创建、部署、评估、观测和排查 Azure AI Foundry agents 与项目，包括 RBAC、配额、标准/私有网络配置，以及 agent 元数据结构布局。

部署

收藏 0GitHub 0

ai-content-pipeline

概览

什么是 ai-content-pipeline？

适合哪些人？

它解决什么问题？

什么时候不适合使用 ai-content-pipeline？

使用方法

前置条件

1. 安装 ai-content-pipeline 技能

2. 使用 inference.sh CLI 登录

3. 运行一个简单的 图片 → 视频 流水线

4. 将流水线范式作为模板使用

模式 1：Image → Video → Audio

模式 2：Script → Speech → Avatar

模式 3：Research → Content → Distribution

5. 集成到你自己的工作流

6. 查看仓库文件获取更深入的指引

常见问题（FAQ）

安装 ai-content-pipeline 实际上会装些什么？

使用 ai-content-pipeline 是否必须安装 inference.sh CLI？

不写代码也能用 ai-content-pipeline 吗？

在这些流水线中可以连接哪些 AI 工具和模型？

ai-content-pipeline 是否适合制作 YouTube 和社交媒体内容？

这个技能如何帮助营销和内容运营？

我可以自定义每条流水线的步骤吗？

ai-content-pipeline 会帮我存储或管理媒体文件吗？

在哪里可以查看或修改底层配置？

评分与评论

3. 运行一个简单的图片 → 视频流水线