video-translation

作者 NoizAI

video-translation 技能可將影片中的口語內容翻譯成其他語言，生成 TTS 配音，並在保留影片內容不變的前提下替換或混合音訊。當你手上已有來源影片、字幕，以及要用來 Translation 的目標語言時，這個技能特別適合實際的影片翻譯使用情境。

Stars498

評論0

加入時間2026年5月14日

分類翻译

安裝指令

npx skills add NoizAI/skills --skill video-translation

編輯評分

這個技能的評分是 74/100，代表它值得收錄，但最好搭配清楚的注意事項一起呈現。目錄使用者可以取得一套真正可用、非空泛的影片翻譯與配音流程，包含明確觸發條件與支援腳本；不過，由於 repo 沒有把完整的安裝／執行路徑講得很透徹，實際導入時仍可能需要一些整合工作。

74/100

亮點

明確的觸發詞與使用情境，讓代理能快速判斷何時該使用這個技能。
SKILL.md 提供了具體流程：下載字幕、逐句翻譯，再替換音軌。
音訊替換與 SRT ducking 的支援腳本顯示出真實的實作意圖，而不只是泛用提示詞。

注意事項

工作流程依賴另一個技能 (`youtube-downloader`) 與 ffmpeg 之類的外部工具，因此安裝與執行可能需要額外設定。
沒有 install 指令，而且截取的流程內容也不完整，會降低目錄使用者一開始就能直接上手的清晰度。

视频 Ffmpeg Tts Captions Youtube Script

總覽

video-translation 技能概覽

video-translation 能做什麼

video-translation 技能會把影片中的口語內容翻成其他語言，接著用 TTS 產生配音音訊，並在保留影片畫面的前提下替換原始音軌。它最適合已經有一支明確目標影片、指定目標語言，而且想要的是「能順暢觀看的配音版」，而不只是螢幕上出現機翻字幕的使用者。

誰適合用 video-translation

這個 video-translation 技能很適合用來在地化 YouTube 風格內容、內訓短片、解說影片，或任何能取得字幕時間軸、或可以先抽出字幕的中短片。若你只需要字幕、原始音訊太吵導致字幕對齊不準，或你要的是接近真人等級的唇形同步，而不是實用型配音版本，這個技能就沒那麼適合。

安裝前先看什麼

真正的決策點在工作流程是否吻合：video-translation 預設你能先取得原始影片與字幕，再仔細翻譯字幕文字、產生 TTS 音訊，最後把結果再 mux 回影片中。如果你的工具鏈本來就包含影片下載、字幕處理，以及以 ffmpeg 為基礎的剪輯流程，這個技能會很合拍；如果沒有，就要預期還得另外補齊這些相依工具的設定。

如何使用 video-translation 技能

安裝並檢視這個技能

在 directory toolchain 裡使用 video-translation install，或者用 npx skills add NoizAI/skills --skill video-translation 從 repo 路徑安裝。安裝完成後，先讀 SKILL.md，再看 scripts/replace_audio.sh 和 scripts/srt_to_duck.py，這樣你就能理解實際上是怎麼做音訊替換，以及字幕驅動的 ducking 是如何運作的。

把粗略需求整理成可用提示

要讓 video-translation usage 發揮最好效果，請提供影片 URL 或檔案路徑、來源語言、目標語言，以及你要完整配音替換還是保留混音。差的提示會只是「幫我翻譯這支影片」；更好的寫法像是：「把這支西班牙文 YouTube 影片翻成英文，產生自然的英文 TTS，並在保留字幕節奏與空白停頓的情況下替換原始音訊。」

符合 repo 設計的實際流程

這個 repo 的邏輯很明確：先下載影片與字幕，再逐句翻譯 SRT，接著生成配音音訊，最後用 ffmpeg 替換或混合音軌。如果有字幕，helper script 可以在有人聲段落把原始音訊壓低，通常會比直接硬切更自然。如果沒有字幕，或字幕對不齊，成品質量通常會明顯下降，因為時間軸本來就是這個流程的一部分價值。

先在 repo 裡確認什麼

先看 SKILL.md，了解觸發意圖、流程順序，以及翻譯提示的大致寫法。接著打開 scripts/replace_audio.sh，看它需要哪些旗標，例如 --video、--audio、--output，以及可選的 --srt；如果你想理解字幕時間戳是怎麼轉成 ducking 指令，再去看 scripts/srt_to_duck.py。這兩個 script 比高層描述更能反映真實用法。

video-translation 技能 FAQ

video-translation 只是提示詞範本嗎？

不是。video-translation 技能是一套以工作流程為核心的設定，不只是措辭建議。它依賴字幕擷取、保持穩定 SRT 格式的翻譯、TTS 產生，以及音訊替換，所以它的操作性遠高於一個泛用的「幫我翻譯這支影片」提示。

什麼情況下 video-translation 很適合？

當你的目標是在另一種語言中播放配音版，而且原始影片可以在本機或透過你現有工具處理時，video-translation 很合適。它特別適合教學影片、訪談、以及旁白型內容，因為這類內容更重視保留視覺畫面，而不是追求完美的語音複製。

主要限制是什麼？

最大的限制在字幕品質、音訊品質與時間對齊。如果原始逐字稿有錯，翻成配音時也會把錯誤一起帶進去；如果 TTS 聲線不自然，成品聽起來還是會有配音感；如果影片有多人重疊發言，靠 ducking 的混音效果通常也不會太乾淨。

初學者需要額外工具嗎？

通常需要。video-translation 預設你對檔案、字幕，以及命令列影片工具有一定熟悉度。即使你是新手，這個技能還是能派上用場，但在信任第一版輸出前，通常得先檢查 helper scripts，並確認 ffmpeg、字幕與 TTS 的步驟都沒有問題。

如何改進 video-translation 技能

給更好的輸入，不只是更多輸入

最強的 video-translation guide 一開始就會把來源語言、目標語言、精確的影片檔案或 URL，以及目標受眾講清楚。還要說明你要正式口吻還是口語口吻、專有名詞與技術詞要不要保留原文，以及最終輸出是否需要保留停頓，讓節奏更自然。

降低常見失敗模式

多數表現差的結果，都是字幕品質不好、專有名詞被亂翻，或 TTS 不理會標點與句子邊界造成的。想改善 video-translation for Translation，就在配音前先確認 SRT，保持索引與時間戳格式不變，並在生成音訊前，把過長的字幕行切成更符合自然口說的單位。

第一版輸出後再迭代

把第一輪當成節奏測試，不要直接當成最終交付。如果配音聽起來太趕，就拉長來源文字中的停頓，或調整句子切分；如果混音壓得太兇，就回頭檢查基於 SRT 的 ducking 行為；如果措辭太像直譯，就把字幕翻譯提示改成要求更口語、更像真人說話的輸出。

善用 scripts 來拉高品質

repo 裡的 helper scripts 其實已經提示了重點：時間軸、替換、以及穩定的音訊切換。如果你要把 video-translation 技能優化成可反覆使用的流程，建議建立一份小檢查清單，涵蓋字幕正確性、TTS 聲線選擇，以及最後的 mux 驗證，這樣同樣的錯誤才不會每支影片都重演。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

baoyu-translate

作者 JimLiu

baoyu-translate 是一套針對長篇文章與 Markdown 文件的翻譯工作流程，提供 quick、normal、refined 模式，支援術語表，並可透過 bun 或 npx 進行分塊處理，以維持輸出一致性。

翻译

收藏 0GitHub 13.2k

readme-i18n

作者 xixu-me

readme-i18n 可將 GitHub 風格的 README 轉成易於維護的多語版本，同時保留 Markdown、連結、程式碼區塊、檔名規則，以及各 README 之間共用的語言選擇器。

翻译

收藏 0GitHub 6

localization

作者 Eronred

使用這個 localization skill 來規劃國際市場的 App Store 在地化。它能幫助團隊判斷該優先布局哪些國家、要先在地化商店頁還是連 App 一起在地化，以及如何避免做出低價值的翻譯工作。非常適合產品行銷、ASO、創辦人與成長營運人員，特別是需要一份兼顧市場優先順序與就緒檢查的實用在地化指南時。

Product Marketing

收藏 0GitHub 0

visa-doc-translate

作者 affaan-m

visa-doc-translate 可將簽證申請文件影像翻譯成英文，並產生包含原始頁面與譯文的雙語 PDF。它針對結構化的簽證文件而設計，支援 OCR 備援、旋轉處理，並盡量保留姓名、日期與金額。

翻译

收藏 0GitHub 156.3k

translate-book

作者 deusyu

translate-book 是一個適用於 PDF、DOCX 與 EPUB 檔案的書籍翻譯技能。它會先將輸入內容轉成 Markdown 分段，再透過平行子代理進行翻譯，接著驗證分段完整性，最後重建為 HTML、DOCX、EPUB 和 PDF 輸出。適合用在長篇內容的可重複 translate-book 翻譯工作流程。

翻译

收藏 0GitHub 681

azure-ai-translation-text-py

作者 microsoft

azure-ai-translation-text-py 協助後端團隊使用 Azure AI Text Translation 的 Python SDK，進行翻譯、音譯、語言偵測與字典詞彙查詢。內容涵蓋安裝、驗證與使用指引，方便在生產環境中搭配 Azure 憑證與端點設定整合應用程式。

後端开发

收藏 0GitHub 0

frontend-design

作者 anthropics

frontend-design 協助你把模糊的 UI 構想變成具有明確美感方向的獨特、可上線前端介面，產出真實可用的 frontend 程式碼，減少千篇一律的 AI 風格。

UI 設計

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可將同事文件、聊天紀錄、電子郵件、截圖、Feishu 與 DingTalk 資料整理成可編輯的 AI 技能，並分別產出工作與人物設定內容，也提供後續持續優化的更新流程。

Skill 編寫

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一個工作流程技能，用於在 HyperFrames 中建立以 HTML 為基礎的影片組成內容。當你需要結構化、以程式碼為核心的 hyperframes 來處理影片剪輯時，可用於標題卡、疊加圖層、字幕、旁白、音訊反應動態，以及場景轉場。它更重視版面配置、時間安排與動畫決策，而不是泛用的、只靠提示詞的影片需求。

视频编辑

收藏 0GitHub 2.7k

kreuzberg

作者 kreuzberg-dev

這個 kreuzberg 技能可協助你安裝並使用 Kreuzberg 進行文件擷取，支援 91 種以上格式，包括 PDF、Office 檔案、圖片、HTML、電子郵件與壓縮檔。內容涵蓋 Python、Node.js/TypeScript、Rust 與 CLI 工作流程，適用於 OCR、表格、中繼資料、批次處理，以及實務解析指引。

PDF 处理

收藏 0GitHub 0

skill-creator

作者 anthropics

skill-creator 是一個用於撰寫技能的 meta-skill，可協助起草新技能、修改既有 `SKILL.md`、執行 eval、比較不同版本，並透過 repository 腳本與審查工具優化觸發描述。

Skill 編寫

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 可協助你在 Python 中使用 Microsoft Entra ID 設定 Azure 驗證。可用來選擇 DefaultAzureCredential、managed identity 或 service principal 驗證，設定環境變數，並排除存取控制與 credential chain 問題。安裝指引、使用模式與實用設定說明皆根據 repo skill file 整理而成。

存取控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一個實用技能，協助安裝並使用 Claude API 與 Anthropic SDK。它可幫助開發者在 SDK 與原生 HTTP 方案間做選擇、辨識對應語言文件，並以較少摸索完成串流、工具使用、檔案、批次與錯誤處理。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可協助你找到 Cloudflare Workers 正確的 CLI 指令、設定結構與部署步驟。適合用在 wrangler 的使用方式、wrangler 安裝檢查，以及在為 Backend Development 建置或交付 Workers 時，取得實用的 wrangler 指南。

後端开发

收藏 0GitHub 1.3k

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

clickhouse-architecture-advisor

作者 ClickHouse

clickhouse-architecture-advisor 協助設計 ClickHouse 工作負載，針對資料攝取、分區、JOIN、字典、upsert 與預先聚合做出符合工作負載的決策。它特別適合後端開發、可觀測性、SIEM、產品分析、IoT 遙測，以及金融資料管線。此技能會將建議標示為 official、derived 或 field。

後端开发

收藏 0GitHub 412