video-translation

video-translation 技能可将视频中的口语内容翻译成其他语言，生成 TTS 配音，并在保留视频本体不变的前提下替换或混合音频。对于你已经有源视频、字幕和目标翻译语言的实际视频翻译场景，它尤其合适。

Stars498

收录时间2026年5月14日

分类翻译

安装命令

npx skills add NoizAI/skills --skill video-translation

编辑评分

该技能得分 74/100，说明它值得收录，但更适合配合清晰的使用说明一起呈现。目录用户可以获得一套真实可用、非占位式的视频翻译与配音流程，其中包含明确的触发条件和配套脚本；但由于仓库并未完整说明端到端的安装/运行路径，用户仍需自行完成一些集成工作。

74/100

亮点

明确的触发短语和使用场景，便于代理识别何时调用该技能。
SKILL.md 提供了具体流程：下载字幕、逐句翻译，并替换音轨。
用于音频替换和 SRT ducking 的辅助脚本体现了真实的操作意图，而不只是泛泛的提示词。

注意点

该流程依赖另一个技能 (`youtube-downloader`) 以及 ffmpeg 等外部工具，因此安装和执行可能需要额外配置。
没有安装命令，而且摘录的工作流内容也有部分截断，降低了目录用户上手即用的清晰度。

视频 Ffmpeg Tts Captions Youtube Script

概览

video-translation 技能概览

video-translation 的作用

video-translation 技能会把视频里的口语内容翻译成另一种语言，使用 TTS 生成配音音频，并在保持视频画面不变的前提下替换原始音轨。它最适合已经有明确视频、目标语言，而且希望得到“能看”的配音结果，而不只是屏幕上的机器翻译文本的用户。

适合谁使用

这个 video-translation 技能适合本地化 YouTube 风格内容、内部培训短片、讲解视频，或任何字幕时间轴可用、或者可以提取出来的短到中等时长视频。如果你只需要字幕、源音频噪声太大导致字幕对齐困难，或者你想要的是接近真人级别的口型同步，而不是实用型配音版本，那么它就没那么合适。

安装前要先看什么

这里最关键的判断点是工作流是否匹配：video-translation 默认你能拿到源视频和字幕，认真翻译字幕文本，生成 TTS 音频，再用 mux 把结果重新封装回视频里。如果你现有技术栈已经包含视频下载、字幕处理和基于 ffmpeg 的编辑，这个技能会很顺手；如果没有，就要预留出额外的依赖配置时间。

如何使用 video-translation 技能

安装并先检查技能内容

在目录工具链里使用 video-translation install，或者通过 repo 路径安装：npx skills add NoizAI/skills --skill video-translation。安装后先读 SKILL.md，再查看 scripts/replace_audio.sh 和 scripts/srt_to_duck.py，这样你才能真正理解音轨替换和基于字幕的 ducking 是怎么运作的。

把模糊需求改写成可执行提示词

要获得更好的 video-translation usage，请提供视频 URL 或文件路径、源语言、目标语言，以及你想要完整配音替换还是混音。弱一点的说法是“把这个视频翻译一下”；更好的说法是：“把这个西班牙语 YouTube 视频翻成英文，生成自然的英文 TTS，并在保留字幕时间轴和静音间隙的前提下替换原始音轨。”

与 repo 逻辑一致的实用流程

这个 repo 的处理逻辑是：先下载视频和字幕，再逐句翻译 SRT，接着生成配音音频，最后用 ffmpeg 替换或混合音频。如果有字幕，辅助脚本可以在有语音的片段里压低原始音量，这通常比硬切更自然。如果字幕缺失或对不齐，输出质量往往会明显下降，因为时间轴本身就是这个方案的一部分价值。

先看 repo 里的哪些文件

先看 SKILL.md，了解触发意图、工作顺序和翻译提示词的结构。然后打开 scripts/replace_audio.sh，查看所需参数，比如 --video、--audio、--output，以及可选的 --srt；如果你想弄清楚字幕时间戳是如何转换成 ducking 命令的，再看 scripts/srt_to_duck.py。比起高层描述，这两个脚本更能说明真实用法。

video-translation 技能常见问题

video-translation 只是一个提示词模板吗？

不是。video-translation 更像是一套面向工作流的配置，而不只是措辞提示。它依赖字幕提取、稳定的 SRT 格式翻译、TTS 生成和音轨替换，所以它比泛泛的“把这个视频翻译一下”提示词更偏操作型。

什么时候适合用 video-translation？

当你的目标是在另一种语言里获得可直接播放的配音版本，而且源视频可以通过本地环境或你现有工具链处理时，video-translation 就很适合。它尤其适用于教育视频、访谈和旁白类内容，因为这类内容更看重保留画面轨，而不是完美的语音克隆。

主要限制是什么？

最大的限制来自字幕质量、音频质量和时间对齐。如果源转写本身就错了，翻译后的配音也会继承这些错误；如果 TTS 声音不自然，最终听起来还是像配音；如果视频里有多人抢话，基于 ducking 的混音也未必干净。

新手需要额外工具吗？

通常需要。video-translation 默认你对文件、字幕和命令行视频工具比较熟悉。如果你是新手，这个技能仍然能帮上忙，但你可能需要先看辅助脚本，并在真正信任第一版输出之前，逐步确认 ffmpeg、字幕和 TTS 各个环节都没问题。

如何改进 video-translation 技能

给出更好的输入，而不只是更多输入

最有效的 video-translation guide，一开始就应该明确源语言和目标语言、视频文件或 URL 的准确位置，以及目标受众。还要说明你想要正式口吻还是口语化表达，人名和术语是否保留原文，以及最终成品是否需要保留停顿来获得更自然的节奏。

减少常见失败模式

多数效果不佳的问题，来自字幕质量差、专有名词没处理好，或者 TTS 不顾标点和句子边界。要提升 video-translation for Translation，最好在配音前先核对 SRT，保持索引和时间戳格式不变，并在生成音频前把过长的字幕行拆成更自然的口语单位。

第一版渲染后继续迭代

把第一轮结果当作时间轴测试，而不是最终交付物。如果配音听起来太赶，就延长源文本里的停顿，或者调整句子切分；如果混音压制得太狠，就回头检查基于 SRT 的 ducking 行为；如果措辞太像直译，就把字幕翻译提示词改成要求更口语、更贴近日常说话的输出。

利用脚本把质量再往上推

repo 里的辅助脚本其实已经说明了重点：时间轴、替换和稳定的音频切换。如果你打算把 video-translation 技能做成可重复使用的流程，最好围绕字幕准确性、TTS 音色选择和最终 mux 校验做一个小清单，这样每个视频都不会反复踩同样的坑。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

baoyu-translate

作者 JimLiu

baoyu-translate 是一套面向长文和 Markdown 文档的翻译工作流，提供 quick、normal、refined 三种模式，支持术语表，并可通过 bun 或 npx 进行分块处理，以获得更稳定一致的输出。

翻译

收藏 0GitHub 13.2k

readme-i18n

作者 xixu-me

readme-i18n 可将 GitHub 风格的 README 翻译并整理为易维护的多语言版本，同时保留 Markdown、链接、代码块、文件命名，以及各个 README 文件之间统一的语言切换器。

翻译

收藏 0GitHub 6

localization

作者 Eronred

使用本地化技能为国际市场制定 App Store 本地化方案。它能帮助团队决定要优先覆盖哪些国家、是只本地化商店列表还是连应用本身一起本地化，以及如何避免做低价值的翻译工作。适合需要实用本地化指南、市场优先级判断和准备度检查的产品营销、ASO、创始人和增长运营人员。

产品营销

收藏 0GitHub 0

visa-doc-translate

作者 affaan-m

visa-doc-translate 可将签证申请文件图片翻译成英文，并生成包含原页与译文的双语 PDF。它面向结构化签证材料，支持 OCR 兜底、旋转处理，并尽量保留姓名、日期和金额等关键信息。

翻译

收藏 0GitHub 156.3k

translate-book

作者 deusyu

translate-book 是一款面向 PDF、DOCX 和 EPUB 文件的书籍翻译技能。它会将输入转换为 Markdown 分块，借助并行子代理进行翻译，校验分块完整性，并重建为 HTML、DOCX、EPUB 和 PDF 输出。适用于需要可重复执行的 translate-book 翻译工作流，尤其是长篇内容处理。

翻译

收藏 0GitHub 681

azure-ai-translation-text-py

作者 microsoft

azure-ai-translation-text-py 帮助后端团队使用 Azure AI Text Translation 的 Python SDK 来进行翻译、音译、语言检测和词典术语查询。它提供安装、认证和使用指导，便于结合 Azure 凭据与 endpoint 设置，将其集成到生产应用中。

后端开发

收藏 0GitHub 0

frontend-design

作者 anthropics

frontend-design 帮你把模糊的 UI 想法，转化为有审美导向的量产级界面，实现真实可用的前端代码，而不是千篇一律的 AI 风格。

UI 设计

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可将同事文档、聊天记录、邮件、截图、Feishu 和 DingTalk 数据整理为可编辑的 AI 技能，并分别产出工作风格与人物画像内容，还提供持续迭代的更新流程。

Skill 编写

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一项工作流技能，用于在 HyperFrames 中构建基于 HTML 的视频合成。适用于需要结构化、以代码为先的 hyperframes 视频编辑场景，比如标题卡、叠加层、字幕、配音、音频驱动动效和场景转场。它更强调布局、时序和动画决策，而不是泛泛的只靠提示词生成视频请求。

视频编辑

收藏 0GitHub 2.7k

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 帮助你在 Python 中使用 Microsoft Entra ID 配置 Azure 身份验证。它适合用于选择 DefaultAzureCredential、managed identity 或 service principal 认证，配置环境变量，并排查访问控制和凭据链问题。安装说明、使用模式和实用的配置提示均基于 repo skill file。

访问控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一项实用技能，帮助开发者安装并使用 Claude API 与 Anthropic SDK。它可协助选择合适的 SDK 或原生 HTTP 方案，识别对应语言文档，并更稳妥地实现流式输出、tool use、文件、批处理和错误处理，减少试错成本。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可帮助你找到 Cloudflare Workers 的正确 CLI 命令、配置结构和部署步骤。可用于 wrangler 的使用、wrangler 安装检查，以及在构建或交付 Workers 时获取一份实用的 wrangler 指南，适合 Backend Development 场景。

后端开发

收藏 0GitHub 1.3k

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

clickhouse-architecture-advisor

作者 ClickHouse

clickhouse-architecture-advisor 可帮助设计 ClickHouse 工作负载，并针对数据摄取、分区、JOIN、字典、upsert 和预聚合做出符合工作负载的决策。它尤其适用于后端开发、可观测性、SIEM、产品分析、IoT 遥测和金融数据管道。该技能会将建议标记为 official、derived 或 field。

后端开发

收藏 0GitHub 412