transcribe-video

作者 rameerez

transcribe-video skill 會使用 AWS Transcribe 將影片或音訊檔轉成 .srt、.vtt 和 .txt 輸出。當你需要字幕、可搜尋的逐字稿，或乾淨的口語內容文字版時，很適合用來處理 transcribe-video；也適用於 Format Conversion 工作流程中的 transcribe-video 需求。

Stars23

評論0

加入時間2026年5月9日

分類格式转换

安裝指令

npx skills add rameerez/claude-code-startup-skills --skill transcribe-video

編輯評分

這個 skill 的評分是 78/100，屬於目錄中值得考慮的項目：它提供一個清楚、真實的工作流程，可用 AWS Transcribe 將影片或音訊轉成 SRT/VTT 與純文字，安裝決策也相對明確。不過使用前仍要預留一些設定成本，因為它仰賴 ffmpeg、AWS CLI，以及已設定好的 AWS 權限。

78/100

亮點

觸發條件與輸出契約都很明確：可對影片或音訊檔路徑進行轉錄，支援可選的語言代碼，並產生 .srt、.vtt 與 .txt 檔案。
操作流程具體：前置需求、音訊擷取、暫存 S3 上傳、AWS Transcribe 工作、結果下載與清理都有說明。
來自 repo 的內容支撐度不錯：有效的 frontmatter、完整的內文、code fences 與檔案參照，讓 agent 相較一般提示更不容易猜測過頭。

注意事項

需要外部設定與憑證：ffmpeg、AWS CLI，以及 s3:* 和 transcribe:* 權限都是必要條件。
沒有提供安裝指令或支援腳本／資源，使用者必須依照文件步驟手動操作。

Aws Ffmpeg Transcription 视频音频

總覽

transcribe-video 技能總覽

transcribe-video 的用途

transcribe-video 技能會使用 AWS Transcribe，將影片或音訊檔轉成 .srt、.vtt 和 .txt 輸出。當你需要字幕、可搜尋的逐字稿，或是一份乾淨的純文字口語內容版本，而不想手動聽打時，它最實用。若你的工作流程本來就有 AWS，transcribe-video 技能會很適合你，因為它提供的是可重複執行、以檔案為核心的轉錄流程。

適合哪些人使用

如果你處理的是會議錄影、訪談、網路研討會、產品示範或課程影片，且需要在製作進度內快速拿到逐字稿，就適合用這個技能。它特別適合在意字幕格式、而不只是想要一份文字轉寫的人。如果你需要 transcribe-video for Format Conversion，這個技能可以把原始媒體轉成更方便後續重用的字幕與逐字稿成品。

先了解的主要取捨

最大的優點是流程很具體：擷取音訊、上傳、執行轉錄工作，然後清理資源。比起一句模糊的「幫我轉錄這段內容」，transcribe-video 更容易落地成標準作業流程。主要限制是依賴較多：你需要 ffmpeg、AWS CLI，以及有效的 AWS 權限。如果這些工具原本就沒有，安裝與設定成本可能會讓一次性的使用不划算。

如何使用 transcribe-video 技能

安裝與就緒檢查

進行 transcribe-video install 時，使用 npx skills add rameerez/claude-code-startup-skills --skill transcribe-video 來加入這個技能。執行前，先確認已安裝 ffmpeg 和 aws，並且 aws configure 已設定好有效憑證。這個技能也需要建立與刪除 S3 bucket，以及啟動/刪除 Transcribe jobs 的權限，所以即使指令看起來正確，若 AWS 帳號權限過嚴，還是可能失敗。

提供技能可用的輸入

這個技能預期你提供媒體檔路徑，並可選擇加上語言代碼，例如 en-US 或 es-ES。較弱的請求是「幫我轉錄這支影片」；較好的寫法則是 transcribe-video /path/to/demo.mp4 en-US，或是「把 /work/interview.mp4 轉成英文的 SRT、VTT 和 TXT，並清理臨時 AWS 資源。」如果已知語言，請直接附上。若檔案雜訊多、時間長，或是多人對話，也要事先說明，因為這些條件對準確度的影響，往往比指令格式本身更大。

建議的工作流程

先閱讀 SKILL.md，再檢查它引用到的 repository 檔案路徑，尤其是 README.md、AGENTS.md、metadata.json，以及如果本機環境中存在的話，rules/、resources/ 或 references/ 資料夾。這個 repo 的原始內容刻意做得很精簡，所以真正重要的是理解整個流程：音訊擷取、暫時性 S3 上傳、Transcribe job 執行、輸出下載，以及清理。這個順序很關鍵，因為失敗通常發生在權限、檔名，或清理步驟，而不是轉錄本身。

提升輸出品質的技巧

請使用音訊品質最好的來源檔。如果影片有多條音軌、壓縮品質差，或背景音樂干擾，先處理好再轉錄。提示技能時，建議用明確的檔名與輸出期待，例如「保留原始 base filename」或「我需要字幕格式和純文字逐字稿，方便編輯」。如果你想讓 transcribe-video usage 更可預期，最好直接指定語言代碼、輸出位置，以及你希望逐字稿偏向字幕用途，還是偏向閱讀用途。

transcribe-video 技能 FAQ

這個比一般通用提示更好嗎？

通常是的，尤其當你要的是可重複執行的轉錄流程，而不是一次性的回答。通用提示可以要求逐字稿，但它不會穩定處理 AWS Transcribe 的設定、音訊擷取、暫存 bucket 建立與清理步驟。當工作需要檔案、格式與操作紀律時，transcribe-video 技能會實用得多。

使用它一定要有 AWS 嗎？

是。這個技能依賴 AWS Transcribe 和 S3，不是純本機轉錄工具。如果你無法使用 AWS 憑證，或不想管理雲端權限，這大概不是最適合的技能。在那種情況下，本機語音轉文字工具可能更合適。

這個技能適合新手嗎？

只有在你願意安裝命令列工具並授權 AWS 權限時，才算對新手友善。轉錄流程本身很直接，但設定常常會卡在第一次使用。新手通常最適合完全照著 repo 預期的檔案路徑與語言代碼格式輸入，然後一次只調整一個變數。

什麼情況下不該用 transcribe-video？

如果只是小型、一次性、可丟可不丟的任務，而且你又沒有事先設定好 AWS，就不建議使用。當你需要離線處理、自訂說話人分離邏輯，或比基本逐字稿產生更深入的編輯整理時，也不適合。若你的目標只是摘要口語內容，這個技能的基礎設施成本可能高於你真正需要的程度。

如何改進 transcribe-video 技能

提供更完整的來源脈絡

最好的結果來自你清楚說明檔案是什麼，以及輸出最該重視什麼。例如：「這是一支 42 分鐘的產品 demo，只有一位講者，音質清楚；請產出準確的英文字幕與易讀逐字稿。」這會比單純給一個路徑更好，因為它能幫流程優先處理語言、格式，以及較可能出錯的環節。

降低可避免的轉錄錯誤

如果音訊混濁、夾雜音樂，或是來自吵雜環境，先改善來源再跑技能。若影片包含多種語言，請直接說明要轉錄哪一種語言。如果主要目標是字幕，也要明講，這樣輸出的評估重點才會放在時間軸與可讀性，而不只是原始文字準確度。這些細節，比籠統要求「品質更好」有用得多。

先出第一版，再迭代

請分開檢視 .srt、.vtt 和 .txt 的輸出。字幕可能在技術上正確，卻太長不適合直接顯示；而純文字逐字稿可能還需要標點或說話者整理，才適合做筆記。如果第一版已經接近但還不夠理想，與其事後硬修，不如重新執行 transcribe-video，並提供更清楚的語言代碼、更好的音訊來源，或更聚焦的輸出目標。

留意常見失敗模式

最常見的問題包括缺少 ffmpeg、AWS CLI 設定錯誤、IAM 權限不足，以及不小心保留了臨時 AWS 資源。如果執行失敗，請先檢查前置需求，再檢查權限，最後確認檔案路徑是否正確。對 transcribe-video 來說，成功與否重點不在提示多聰明，而在於你是否提供了有效的媒體檔、正確的語言提示，以及一個能端到端完成工作的 AWS 環境。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

kreuzberg

作者 kreuzberg-dev

這個 kreuzberg 技能可協助你安裝並使用 Kreuzberg 進行文件擷取，支援 91 種以上格式，包括 PDF、Office 檔案、圖片、HTML、電子郵件與壓縮檔。內容涵蓋 Python、Node.js/TypeScript、Rust 與 CLI 工作流程，適用於 OCR、表格、中繼資料、批次處理，以及實務解析指引。

PDF 处理

收藏 0GitHub 0

xlsx

作者 anthropics

xlsx skill 可協助代理在交付成果必須是試算表時，讀取、編輯、修復、建立與轉換 .xlsx、.xlsm、.csv 和 .tsv 檔案。它特別適合保留範本格式的更新、兼顧公式安全的活頁簿編修、雜亂表格清理，以及搭配 repo 腳本進行封裝、驗證與重新計算的實務試算表流程。

試算表工作流

收藏 0GitHub 105.1k

pdf

作者 anthropics

pdf skill 可支援多種 PDF 處理工作，包括文字擷取、合併與拆分、頁面轉圖片，以及 PDF 表單流程。特別適合用腳本檢查可填欄位、擷取表單中繼資料，並驗證不可填表單版面。

PDF 处理

收藏 0GitHub 105.1k

baoyu-youtube-transcript

作者 JimLiu

baoyu-youtube-transcript 可從 YouTube URL 或影片 ID 擷取逐字稿、字幕與封面圖片。支援語言選擇、翻譯、輸出為 Markdown 或 SRT、利用快取重新格式化，並在 InnerTube API 無法取得內容時回退到 yt-dlp，提高逐字稿擷取的可靠性。

格式转换

收藏 0GitHub 13.2k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI，搭配 Chrome CDP、網站 adapter 與通用 fallback，將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程，以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换

收藏 0GitHub 13.2k

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

minimax-xlsx

作者 MiniMax-AI

minimax-xlsx 技能可用 Excel 優先的工作流程來建立、讀取、編輯、驗證與格式化 Excel 活頁簿。當你需要能保留公式、樣式、工作表版面與活頁簿行為的結構化檔案時，minimax-xlsx 很適合用於 Spreadsheet Workflows。它支援 .xlsx、.xlsm、.csv 和 .tsv 工作，包括分析、新建活頁簿、最小侵入式編輯、公式修復與驗證。minimax-xlsx 指南是為真實的活頁簿交付而設計，不是給扁平表格用的。

試算表工作流

收藏 0GitHub 0

baoyu-format-markdown

作者 JimLiu

baoyu-format-markdown 可將純文字或雜亂的 Markdown 整理成更乾淨、可發布的 Markdown，同時保留原意。它會修復 frontmatter、標題、清單、程式碼區塊、引言與 CJK 間距，適合用於 Format Conversion，而不需改寫內容。

格式转换

收藏 0GitHub 13.2k

baoyu-danger-x-to-markdown

作者 JimLiu

baoyu-danger-x-to-markdown 可將 X 貼文、串文與部分文章轉成含 YAML front matter 的 Markdown。它透過 `scripts/` 內的腳本搭配 `bun` 或 `npx -y bun` 執行，支援以 cookie 存取與 consent 流程；相較於泛用型 prompt，更適合可重複執行的 Format Conversion 工作流程。

格式转换

收藏 0GitHub 13.2k

baoyu-markdown-to-html

作者 JimLiu

baoyu-markdown-to-html 可將 Markdown 轉成適合微信風格發佈的樣式化 HTML。支援主題、程式碼高亮、數學公式、PlantUML、註腳、圖片處理，以及可選的連結引用註記，並可透過 bun 或 npx -y bun 執行。

格式转换

收藏 0GitHub 13.2k

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能可透過 Nutrient DWS API 進行 PDF 處理與文件自動化。可轉換、OCR、擷取、遮罩、簽署、加浮水印，並填寫 PDF、DOCX、XLSX、PPTX、HTML 與圖片等檔案。

PDF 处理

收藏 0GitHub 156.2k

speech-to-text

作者 NoizAI

speech-to-text 技能可將支援的音訊檔轉寫為純文字，並提供時間戳記、說話者標籤與 JSON 輸出等選項。它專為需要可重複執行的實務 speech-to-text 工作流程而設計，包括訪談、會議、Podcast、講座，以及重視轉寫一致性的自動化任務。

工作流自動化

收藏 0GitHub 498

markitdown

作者 K-Dense-AI

markitdown 可將檔案與 Office 文件轉換為 Markdown，讓內容更容易閱讀、切分、搜尋，也更適合 LLM 工作流程。這個 markitdown 技能支援 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、含 OCR 的圖片，以及音訊轉錄，是一份實用的 markitdown 格式轉換指南。

格式转换

收藏 0GitHub 0

pdf

作者 openai

這個 pdf skill 適合處理 PDF Processing 任務，當版面、分頁與渲染後的輸出很重要時特別有用。它能幫助你以以視覺為優先的工作流程來讀取、建立、編輯與審閱 PDF：先渲染頁面、檢查結果，再進行調整。當你需要可靠的 PDF 安裝方式、pdf 使用方式，以及一份實用的 pdf 指南來確保文件精準時，這個 skill 很適合派上用場。

PDF 处理

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill，可透過本機 `web2md` CLI，將即時網頁整理成乾淨的 Markdown；面對 JS 渲染頁面、互動式流程與批次 URL 轉換時，會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换

收藏 0GitHub 1.3k

defuddle

作者 kepano

defuddle 可透過 Defuddle CLI 從網頁擷取乾淨的 markdown，移除雜訊，適合研究、文件整理與文章處理。適用於一般 HTML 頁面，可用 npm 安裝，但不適合以 `.md` 結尾的 URL。

Web 研究

收藏 0GitHub 19.7k