baoyu-youtube-transcript

作者 JimLiu

baoyu-youtube-transcript 可从 YouTube URL 或 video ID 提取 transcript、subtitles 和封面图。它支持语言选择、翻译、Markdown 或 SRT 输出、基于缓存的重新格式化，并在 InnerTube API 不可用时回退到 yt-dlp，以更稳定地获取 transcript。

Stars13.2k

收录时间2026年4月5日

分类格式转换

安装命令

npx skills add JimLiu/baoyu-skills --skill baoyu-youtube-transcript

编辑评分

这项 skill 评分为 84/100，适合收录到目录中，尤其适合需要稳定提取 YouTube transcript、又希望比通用提示词少走弯路的用户。仓库展示了真实可运行的工作流，包含明确的触发方式、CLI 用法、回退机制和测试，因此代理大概率能正确调用它，并较有把握地产出 transcript、subtitles 或封面图。

84/100

亮点

触发性很强：描述中明确写出了具体用户意图和输入模式，例如 YouTube URL、transcript/subtitle 请求，以及封面图请求。
具备较强的可操作性：`SKILL.md` 记录了使用方式，仓库还包含可运行的 TypeScript/Bun CLI，以及 7 个用于抓取、解析、缓存和格式化 transcript 的配套脚本。
对代理有实际增益：它直接使用 YouTube InnerTube，在受限时会回退到 yt-dlp，并支持语言选择/翻译、chapters、speaker-processing prompt，以及基于缓存的重新格式化。

注意点

安装和运行时配置说明仍不算完全清晰：`SKILL.md` 提到了 Bun/`npx` 依赖和运行时解析方式，但 skill 文件里没有提供一个简单直接的安装命令。
部分高级行为仍需要代理自行判断，尤其是 speaker identification 和 chapter processing，这些更多是通过 prompt 引导，而不是由一套严格约束的端到端工作流来保证。

视频音频翻译 Markdown Cli Bun TypeScript

概览

baoyu-youtube-transcript skill 概览

baoyu-youtube-transcript 擅长什么

baoyu-youtube-transcript 是一个面向 YouTube 文稿提取的 skill，适合那些需要可复用文本文件的人，而不只是想在屏幕上看字幕。它可以根据 YouTube URL 或 video ID 下载 transcript、subtitles 和封面图，支持语言选择与翻译，还能基于已缓存的数据重新格式化为 markdown 或 SRT，而无需再次抓取。它最大的实际优势是稳定性：优先使用 YouTube 的 InnerTube API，在直接访问受阻时再回退到 yt-dlp。

哪些用户最适合，真正要解决的工作是什么

这个 skill 最适合研究人员、做笔记的人、归档人员、内容再利用团队，以及需要把视频做 Format Conversion 转成 markdown、subtitle 或 transcript 资产的 agent。它真正要完成的任务通常是：“把这个视频的文稿提取出来，拿到我需要的语言版本，如果时间戳或章节有价值就保留下来，并且按之后还能复用的文件结构保存好。”

安装前值得先了解的关键差异

和泛泛的“总结这个 YouTube 视频”提示词相比，baoyu-youtube-transcript 提供的是基于文件的输出、缓存能力、按语言感知的轨道选择，以及更可控、更确定的提取路径。仓库里还提供了一个说话人后处理提示词文件 prompts/speaker-transcript.md，如果你的最终目标是更干净、可编辑的 transcript，而不是原始字幕行，这一点会很重要。

如何使用 baoyu-youtube-transcript skill

安装环境与运行前提

要安装和运行 baoyu-youtube-transcript，你需要本地可用的 bun 或 npx。这个 skill 的脚本位于 skills/baoyu-youtube-transcript/scripts/，并且 SKILL.md 明确说明了运行时解析顺序：优先 bun，其次 npx -y bun。如果你还在评估是否采用，建议先读这些文件：

SKILL.md
scripts/main.ts
scripts/youtube.ts
prompts/speaker-transcript.md
scripts/main.test.ts

沿着这条路径读仓库，通常比把整个 repo 全翻一遍更快看清真实的 CLI 行为、fallback 逻辑和后处理流程。

baoyu-youtube-transcript 实际是怎么用的

在常规的 baoyu-youtube-transcript 使用流程里，你会用 YouTube URL 或 11 位 video ID 调用主脚本。脚本可以：

获取 transcript track
优先选择更好的字幕格式，比如 json3
在手动字幕和自动生成字幕之间做选择
在可用时进行翻译
输出 markdown 或 SRT
在输出目录下缓存 metadata 和 transcript payload

真正影响结果质量的，通常不是写很长的 prompt，而是把提取意图说清楚。一个好的请求应明确写出：

视频 URL 或 ID
语言优先级顺序
是否接受自动生成字幕
目标输出格式：markdown 或 SRT
是否需要时间戳、章节或说话人

更强一点的请求可以像这样：“Use baoyu-youtube-transcript on this YouTube URL, prefer en then zh-Hans, allow generated captions, output markdown with timestamps, and save under a reusable output directory.”

能减少猜测成本的 prompting 与工作流

如果你是通过 AI agent 来调用它，最好把模糊目标改写成可直接执行的指令。例如：

Extraction: “Fetch the transcript for this video ID in en; if unavailable, use translated en from another track.”
Formatting: “Return markdown with timestamps for review.”
Enhancement: “Then use prompts/speaker-transcript.md to convert the raw transcript into a chaptered, speaker-labeled transcript without translating.”

这个两步式工作流很关键，因为说话人标注是独立的后处理任务，并不等同于下载原始字幕。prompts/speaker-transcript.md 强调逐字忠实和说话人命名一致，这对访谈、播客和课程 transcript 特别有用。

输出结构、缓存机制与实用建议

baoyu-youtube-transcript skill 会保存 metadata 和 transcript 缓存，因此重复格式化时会更快。如果你希望针对同一个视频同时保留原始版和精修版输出，这一点尤其有价值。实用建议如下：

如果你会反复处理同一批视频，使用稳定的 outputDir。
在做说话人清洗之前，先保留原始 transcript 输出。
关注时间精度时用 SRT；更看重可读性时用 markdown。
如果章节提取很重要，检查视频 description 里是否包含带时间戳的章节，因为脚本会结合 description 和 duration 解析 chapters。

baoyu-youtube-transcript skill 常见问题

baoyu-youtube-transcript 比普通 prompt 更好吗？

如果你需要的是可复现的提取结果，而不是“尽力推断”的回答，那答案是肯定的。普通 prompt 无法稳定下载 subtitle track、检查可用语言、缓存原始资产，也不能在失败时回退到 yt-dlp。当你的任务重点是采集和转换，而不只是做摘要时，baoyu-youtube-transcript 会更强。

什么情况下这个 skill 不适合？

如果目标视频没有可访问的 transcript track，而你又希望它仅凭音频完成完整的 speech-to-text transcription，那它就不适合。这个 repo 的设计核心是 YouTube transcript/subtitle 获取，不是独立的 ASR pipeline。另一方面，如果你只是想快速看一段人工摘要，并不需要保存文件，那用它也会显得偏重。

baoyu-youtube-transcript 对新手友好吗？

算是中等门槛。这个 skill 以脚本驱动为主，不是点点按钮就能完成，所以最好对 bun、npx、路径和输出目录有基本熟悉度。好在这个 repo 的实现细节比较完整：scripts/main.test.ts 能帮助你理解选择逻辑，SKILL.md 也给出了安全起步所需的命令模式。

如何改进 baoyu-youtube-transcript skill 的使用效果

想让 baoyu-youtube-transcript 输出更好，先把输入说清楚

想提升 baoyu-youtube-transcript 的结果，最快的方法就是明确 transcript 选择条件。要写清语言优先级、是否优先手动字幕，以及是否接受自动生成字幕。如果这些不说明白，最终虽然也可能拿到可用结果，但很可能是质量较低的 track，或者是你没预期到的翻译版本。

尽早处理常见失败场景

常见问题包括：无效 video identifier、直接抓取被拦截、目标语言字幕缺失，以及把“翻译字幕”和“总结 transcript”混为一谈。如果提取失败，先从概念上检查 scripts/youtube.ts 的处理方式：这个 skill 本身已经有 fallback 路径，所以你下一步通常应该是调整语言限制，或者允许自动生成字幕，而不是把整个 prompt 全部重写。

拿到第一版 transcript 后再迭代

如果你把 baoyu-youtube-transcript 用于 Format Conversion，最好的工作流通常是迭代式的：

先抓取原始 transcript
检查语言和完整性
有需要的话换一种格式重新运行
再做说话人/章节后处理

如果第一版 markdown 看起来比较乱，不要立刻否定这个 skill。更好的做法是保留缓存下来的原始文件，重新跑格式化，或者套用 prompts/speaker-transcript.md 生成更干净的最终文档。也正是在这个阶段，它会比一次性的下载脚本更有价值。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

xlsx

作者 anthropics

xlsx skill 适合在交付物必须是电子表格时，让智能体读取、编辑、修复、创建并转换 .xlsx、.xlsm、.csv 和 .tsv 文件。它尤其擅长保留模板的更新、尽量不破坏公式的工作簿编辑、杂乱表格清洗，以及借助仓库脚本完成打包、校验和重算的实用电子表格工作流。

电子表格工作流

收藏 0GitHub 105.1k

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可借助内置的 baoyu-fetch CLI，将在线 URL 转为 Markdown，支持 Chrome CDP、站点适配器以及通用回退方案。适合在安装前了解 Bun 运行时要求、首次使用所需的 EXTEND.md 配置，以及处理 X、YouTube、Hacker News 和需渲染页面时的具体用法。

格式转换

收藏 0GitHub 13.2k

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

minimax-xlsx

作者 MiniMax-AI

minimax-xlsx 技能可帮助你以 Excel 优先的工作流创建、读取、编辑、验证和格式化 Excel 工作簿。适用于需要保留公式、样式、工作表布局和工作簿行为的结构化文件处理场景。它支持 .xlsx、.xlsm、.csv 和 .tsv 任务，包括分析、新建工作簿、最小侵入式编辑、公式修复和校验。minimax-xlsx 指南面向真实工作簿交付，而不是扁平表格。

电子表格工作流

收藏 0GitHub 0

baoyu-format-markdown

作者 JimLiu

baoyu-format-markdown 可将纯文本或杂乱的 Markdown 整理为更干净、适合发布的 Markdown，同时尽量保留原意。它会修复 frontmatter、标题、列表、代码块、引用以及中日韩文字间距，因此很适合用于 Format Conversion，而不是改写内容。

格式转换

收藏 0GitHub 13.2k

baoyu-danger-x-to-markdown

作者 JimLiu

baoyu-danger-x-to-markdown 可将 X 的帖子、线程以及部分文章转换为带 YAML front matter 的 Markdown。它通过 `scripts/` 中的脚本配合 `bun` 或 `npx -y bun` 运行，支持基于 cookie 的访问与 consent 流程；相比通用提示词，更适合需要稳定复用的 Format Conversion 工作流。

格式转换

收藏 0GitHub 13.2k

baoyu-markdown-to-html

作者 JimLiu

baoyu-markdown-to-html 可将 Markdown 转换为适合微信排版风格的样式化 HTML。它支持主题、代码高亮、数学公式、PlantUML、脚注、图片处理，以及可选的链接引用，并可通过 bun 或 `npx -y bun` 在运行时执行。

格式转换

收藏 0GitHub 13.2k

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

speech-to-text

作者 NoizAI

speech-to-text 技能可将受支持的音频文件转写为纯文本，并支持时间戳、说话人标签和 JSON 输出。它面向需要稳定、可重复流程的实际 speech-to-text 场景，适用于访谈、会议、播客、讲座，以及对转写一致性要求较高的自动化任务。

工作流自动化

收藏 0GitHub 498

transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿，或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换

收藏 0GitHub 23

markitdown

作者 K-Dense-AI

markitdown 可将文件和办公文档转换为 Markdown，便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写，是一份实用的 markitdown 格式转换指南。

格式转换

收藏 0GitHub 0

pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中，使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法，以及面向文档准确性的实用 pdf 指南时使用。

PDF 处理

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一项用于格式转换的 skill，可通过本地 `web2md` CLI 将在线网页转换为干净的 Markdown；对于 JS 渲染页面、交互式流程和批量 URL 转换，则会配合 Chromium 系浏览器完成处理。它只会在被用户明确点名时运行。

格式转换

收藏 0GitHub 1.3k

defuddle

作者 kepano

defuddle 可通过 Defuddle CLI 从网页中提取干净的 markdown，去除页面杂项，适合研究、文档整理和文章采集。适用于常规 HTML 页面，可通过 npm 安装；对于以 .md 结尾的 URL 则不建议使用。

Web 研究

收藏 0GitHub 19.7k