baoyu-youtube-transcript

作者 JimLiu

baoyu-youtube-transcript 可從 YouTube URL 或影片 ID 擷取逐字稿、字幕與封面圖片。支援語言選擇、翻譯、輸出為 Markdown 或 SRT、利用快取重新格式化，並在 InnerTube API 無法取得內容時回退到 yt-dlp，提高逐字稿擷取的可靠性。

Stars13.2k

評論0

加入時間2026年4月5日

分類格式转换

安裝指令

npx skills add JimLiu/baoyu-skills --skill baoyu-youtube-transcript

編輯評分

這個 skill 評分為 84/100，對於需要穩定擷取 YouTube 逐字稿、又不想只靠泛用提示詞反覆摸索的使用者來說，是相當不錯的目錄收錄候選。此 repo 展示了可實際執行的流程，包含明確的觸發條件、CLI 用法、fallback 行為與測試，因此 agent 有相當高的機會正確呼叫它，並以合理信心產出逐字稿、字幕或封面圖片。

84/100

亮點

觸發性強：描述中清楚點出具體的使用意圖與輸入模式，例如 YouTube URL、逐字稿／字幕需求，以及封面圖片請求。
實作內容扎實：SKILL.md 有記錄使用方式，repo 也包含可運作的 TypeScript/Bun CLI，以及 7 個支援腳本，用於抓取、剖析、快取與格式化逐字稿。
對 agent 有實質加成：可直接使用 YouTube InnerTube，遭阻擋時會回退到 yt-dlp，並支援語言選擇／翻譯、章節、說話者處理 prompt，以及供重新格式化使用的快取。

注意事項

安裝與執行環境設定仍只有部分資訊清楚：SKILL.md 提到 Bun/npx 需求與執行期解析方式，但 skill 檔案中沒有提供簡單直接的安裝指令。
部分進階行為仍需 agent 自行判讀，尤其是說話者辨識與章節處理；目前主要是透過 prompt 引導，而非一套嚴格約束的端到端流程。

视频音频翻译 Markdown Cli Bun TypeScript

總覽

baoyu-youtube-transcript skill 概覽

baoyu-youtube-transcript 擅長什麼

baoyu-youtube-transcript 是一個用來擷取 YouTube 逐字稿的 skill，適合需要可直接使用文字檔的人，而不只是想在畫面上看字幕。它可以從 YouTube URL 或影片 ID 下載逐字稿、字幕與封面圖片，支援語言選擇與翻譯，也能在不重新抓取的情況下，把已快取的資料重新整理成 markdown 或 SRT。它在實務上最大的優勢是穩定性：會先使用 YouTube 的 InnerTube API，若直接存取受阻，再退回使用 yt-dlp。

最適合的使用者與實際要完成的工作

這個 skill 最適合研究人員、做筆記的人、典藏／歸檔工作者、內容再利用編輯者，以及需要把影片做 Format Conversion 轉成 markdown、字幕或逐字稿資產的 agent。實際要解決的工作通常是：「把這支影片的內容抓成我需要語言的逐字稿，視情況保留時間戳或章節，並存成之後可以重複利用的檔案結構。」

安裝前值得先知道的關鍵差異

和一般「幫我摘要這支 YouTube 影片」的 prompt 相比，baoyu-youtube-transcript 提供的是以檔案為核心的輸出、快取、具語言判斷的字幕軌選擇，以及更可預期的擷取流程。repo 另外也提供了 prompts/speaker-transcript.md 這個講者處理 prompt；如果你的最終目標是較乾淨、可編修的編輯稿，而不是原始字幕行，這點就很重要。

如何使用 baoyu-youtube-transcript skill

安裝情境與執行環境需求

要安裝與使用 baoyu-youtube-transcript，你需要系統中有 bun 或 npx。這個 skill 的腳本位於 skills/baoyu-youtube-transcript/scripts/，而 SKILL.md 也明確寫出執行時會優先解析為 bun，其次才是 npx -y bun。如果你是在正式採用前做評估，建議先讀這幾個檔案：

SKILL.md
scripts/main.ts
scripts/youtube.ts
prompts/speaker-transcript.md
scripts/main.test.ts

沿著這條路徑看，你會比起整個 repo 到處翻，更快掌握實際 CLI 行為、fallback 邏輯，以及後處理 workflow。

baoyu-youtube-transcript 的實際使用方式

在一般的 baoyu-youtube-transcript 使用流程中，你會用 YouTube URL 或 11 碼影片 ID 呼叫主腳本。這個腳本可以：

抓取逐字稿字幕軌
優先選擇較佳的字幕格式，例如 json3
在手動字幕與自動產生字幕之間做選擇
在可用時進行翻譯
輸出為 markdown 或 SRT
把 metadata 與逐字稿 payload 快取到輸出目錄下

這裡最重要的輸入品質，不是寫很長的 prompt，而是把擷取意圖講清楚。好的請求會明確指定：

影片 URL 或 ID
偏好的語言順序
是否接受自動產生字幕
想要的輸出格式：markdown 或 SRT
是否需要時間戳、章節或講者資訊

更完整的請求會像這樣：「Use baoyu-youtube-transcript on this YouTube URL, prefer en then zh-Hans, allow generated captions, output markdown with timestamps, and save under a reusable output directory.」

降低猜測成本的提示寫法與 workflow

如果你是透過 AI agent 來呼叫它，請把模糊目標改寫成可以直接執行的指令。例如：

Extraction: “Fetch the transcript for this video ID in en; if unavailable, use translated en from another track.”
Formatting: “Return markdown with timestamps for review.”
Enhancement: “Then use prompts/speaker-transcript.md to convert the raw transcript into a chaptered, speaker-labeled transcript without translating.”

這種兩階段 workflow 很重要，因為講者標記是獨立的後處理工作，不等同於下載原始字幕。該 prompt 檔特別強調逐字忠實度與講者名稱一致性，對訪談、podcast 與課程逐字稿尤其實用。

輸出結構、快取與實務建議

baoyu-youtube-transcript skill 會儲存 metadata 與逐字稿快取，因此重複格式化會更快。當你想從同一支影片同時產出原始版與整理版時，這點特別有價值。實務建議如下：

如果你常常回頭重看同一批影片，請使用固定的 outputDir。
在做講者清理前，先保留原始逐字稿輸出。
若時間精度重要，使用 SRT；若可讀性更重要，使用 markdown。
如果你在意章節擷取，請檢查影片描述中是否有時間戳章節，因為腳本會根據描述內容加上片長來解析章節。

baoyu-youtube-transcript skill 常見問題

baoyu-youtube-transcript 比一般 prompt 更好嗎？

是的，當你需要可重現的擷取流程，而不是盡力而為的推論時，答案是肯定的。一般 prompt 無法可靠地下載字幕軌、檢查可用語言、快取原始資產，或在失敗時退回使用 yt-dlp。當你的任務重點是取得內容與格式轉換，而不只是做摘要，baoyu-youtube-transcript 會更強。

什麼情況下這個 skill 不適合？

如果沒有可存取的逐字稿／字幕軌，而你期待它能只靠音訊完成完整的 speech-to-text 轉寫，那它就不適合。這個 repo 的核心是 YouTube 逐字稿／字幕擷取，不是獨立的 ASR pipeline。另一方面，如果你只是想快速看一段人工摘要，也不需要把檔案存下來，那它也可能太重了。

baoyu-youtube-transcript 對新手友善嗎？

算是中等。這個 skill 是以腳本操作為主，不是點選式工具，所以你最好對 bun、npx、路徑與輸出資料夾有基本熟悉度。好消息是，這個 repo 很偏實作導向：scripts/main.test.ts 可以看出選擇邏輯，SKILL.md 也提供了安全上手所需的指令模式。

如何改進 baoyu-youtube-transcript skill 的使用效果

用更好的輸入換取更好的 baoyu-youtube-transcript 輸出

想提升 baoyu-youtube-transcript 結果，最快的方法就是把逐字稿選擇條件講清楚。請明確說出語言優先順序、是否優先手動字幕，以及是否接受自動產生字幕。若省略這些條件，你可能仍會拿到可用結果，但品質較低，或得到不是你原本預期的翻譯版本。

提早處理常見失敗情境

常見問題包括影片 ID 無效、直接抓取被阻擋、目標語言字幕不存在，以及把「翻譯字幕」和「摘要逐字稿」混為一談。若擷取失敗，先從概念上理解 scripts/youtube.ts 的行為：這個 skill 本身已經有 fallback 路徑，因此下一步通常是調整語言限制，或允許使用自動產生字幕，而不是把整個 prompt 重寫一遍。

拿到第一份逐字稿後再迭代

如果你是把 baoyu-youtube-transcript 用在 Format Conversion，最佳 workflow 通常是反覆迭代：

先抓原始逐字稿
確認語言與完整性
有需要再改用其他格式重跑
再套用講者／章節後處理

如果第一次產出的 markdown 看起來很亂，不要急著放棄這個 skill。更好的做法是保留已快取的原始檔，再重新執行格式化，或套用 prompts/speaker-transcript.md 來整理出更乾淨的最終文件。這也是它比一次性下載腳本更有價值的地方。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

kreuzberg

作者 kreuzberg-dev

這個 kreuzberg 技能可協助你安裝並使用 Kreuzberg 進行文件擷取，支援 91 種以上格式，包括 PDF、Office 檔案、圖片、HTML、電子郵件與壓縮檔。內容涵蓋 Python、Node.js/TypeScript、Rust 與 CLI 工作流程，適用於 OCR、表格、中繼資料、批次處理，以及實務解析指引。

PDF 处理

收藏 0GitHub 0

xlsx

作者 anthropics

xlsx skill 可協助代理在交付成果必須是試算表時，讀取、編輯、修復、建立與轉換 .xlsx、.xlsm、.csv 和 .tsv 檔案。它特別適合保留範本格式的更新、兼顧公式安全的活頁簿編修、雜亂表格清理，以及搭配 repo 腳本進行封裝、驗證與重新計算的實務試算表流程。

試算表工作流

收藏 0GitHub 105.1k

pdf

作者 anthropics

pdf skill 可支援多種 PDF 處理工作，包括文字擷取、合併與拆分、頁面轉圖片，以及 PDF 表單流程。特別適合用腳本檢查可填欄位、擷取表單中繼資料，並驗證不可填表單版面。

PDF 处理

收藏 0GitHub 105.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI，搭配 Chrome CDP、網站 adapter 與通用 fallback，將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程，以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换

收藏 0GitHub 13.2k

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

minimax-xlsx

作者 MiniMax-AI

minimax-xlsx 技能可用 Excel 優先的工作流程來建立、讀取、編輯、驗證與格式化 Excel 活頁簿。當你需要能保留公式、樣式、工作表版面與活頁簿行為的結構化檔案時，minimax-xlsx 很適合用於 Spreadsheet Workflows。它支援 .xlsx、.xlsm、.csv 和 .tsv 工作，包括分析、新建活頁簿、最小侵入式編輯、公式修復與驗證。minimax-xlsx 指南是為真實的活頁簿交付而設計，不是給扁平表格用的。

試算表工作流

收藏 0GitHub 0

baoyu-format-markdown

作者 JimLiu

baoyu-format-markdown 可將純文字或雜亂的 Markdown 整理成更乾淨、可發布的 Markdown，同時保留原意。它會修復 frontmatter、標題、清單、程式碼區塊、引言與 CJK 間距，適合用於 Format Conversion，而不需改寫內容。

格式转换

收藏 0GitHub 13.2k

baoyu-danger-x-to-markdown

作者 JimLiu

baoyu-danger-x-to-markdown 可將 X 貼文、串文與部分文章轉成含 YAML front matter 的 Markdown。它透過 `scripts/` 內的腳本搭配 `bun` 或 `npx -y bun` 執行，支援以 cookie 存取與 consent 流程；相較於泛用型 prompt，更適合可重複執行的 Format Conversion 工作流程。

格式转换

收藏 0GitHub 13.2k

baoyu-markdown-to-html

作者 JimLiu

baoyu-markdown-to-html 可將 Markdown 轉成適合微信風格發佈的樣式化 HTML。支援主題、程式碼高亮、數學公式、PlantUML、註腳、圖片處理，以及可選的連結引用註記，並可透過 bun 或 npx -y bun 執行。

格式转换

收藏 0GitHub 13.2k

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能可透過 Nutrient DWS API 進行 PDF 處理與文件自動化。可轉換、OCR、擷取、遮罩、簽署、加浮水印，並填寫 PDF、DOCX、XLSX、PPTX、HTML 與圖片等檔案。

PDF 处理

收藏 0GitHub 156.2k

speech-to-text

作者 NoizAI

speech-to-text 技能可將支援的音訊檔轉寫為純文字，並提供時間戳記、說話者標籤與 JSON 輸出等選項。它專為需要可重複執行的實務 speech-to-text 工作流程而設計，包括訪談、會議、Podcast、講座，以及重視轉寫一致性的自動化任務。

工作流自動化

收藏 0GitHub 498

transcribe-video

作者 rameerez

transcribe-video skill 會使用 AWS Transcribe 將影片或音訊檔轉成 .srt、.vtt 和 .txt 輸出。當你需要字幕、可搜尋的逐字稿，或乾淨的口語內容文字版時，很適合用來處理 transcribe-video；也適用於 Format Conversion 工作流程中的 transcribe-video 需求。

格式转换

收藏 0GitHub 23

markitdown

作者 K-Dense-AI

markitdown 可將檔案與 Office 文件轉換為 Markdown，讓內容更容易閱讀、切分、搜尋，也更適合 LLM 工作流程。這個 markitdown 技能支援 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、含 OCR 的圖片，以及音訊轉錄，是一份實用的 markitdown 格式轉換指南。

格式转换

收藏 0GitHub 0

pdf

作者 openai

這個 pdf skill 適合處理 PDF Processing 任務，當版面、分頁與渲染後的輸出很重要時特別有用。它能幫助你以以視覺為優先的工作流程來讀取、建立、編輯與審閱 PDF：先渲染頁面、檢查結果，再進行調整。當你需要可靠的 PDF 安裝方式、pdf 使用方式，以及一份實用的 pdf 指南來確保文件精準時，這個 skill 很適合派上用場。

PDF 处理

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill，可透過本機 `web2md` CLI，將即時網頁整理成乾淨的 Markdown；面對 JS 渲染頁面、互動式流程與批次 URL 轉換時，會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换

收藏 0GitHub 1.3k

defuddle

作者 kepano

defuddle 可透過 Defuddle CLI 從網頁擷取乾淨的 markdown，移除雜訊，適合研究、文件整理與文章處理。適用於一般 HTML 頁面，可用 npm 安裝，但不適合以 `.md` 結尾的 URL。

Web 研究

收藏 0GitHub 19.7k