格式转换

浏览数据处理下与格式转换相关的 Agent Skill，并比较相近工作流、工具与使用场景。

23 个技能

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

xlsx

作者 anthropics

xlsx skill 适合在交付物必须是电子表格时，让智能体读取、编辑、修复、创建并转换 .xlsx、.xlsm、.csv 和 .tsv 文件。它尤其擅长保留模板的更新、尽量不破坏公式的工作簿编辑、杂乱表格清洗，以及借助仓库脚本完成打包、校验和重算的实用电子表格工作流。

电子表格工作流

收藏 0GitHub 105.1k

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

defuddle

作者 kepano

defuddle 可通过 Defuddle CLI 从网页中提取干净的 markdown，去除页面杂项，适合研究、文档整理和文章采集。适用于常规 HTML 页面，可通过 npm 安装；对于以 .md 结尾的 URL 则不建议使用。

Web 研究

收藏 0GitHub 19.7k

json-canvas

作者 kepano

json-canvas 可帮助创建和编辑有效的 .canvas 文件，用于 Obsidian 风格的看板，正确处理节点、边、ID、坐标、分组和引用等结构。

图表绘制

收藏 0GitHub 19.7k

baoyu-youtube-transcript

作者 JimLiu

baoyu-youtube-transcript 可从 YouTube URL 或 video ID 提取 transcript、subtitles 和封面图。它支持语言选择、翻译、Markdown 或 SRT 输出、基于缓存的重新格式化，并在 InnerTube API 不可用时回退到 yt-dlp，以更稳定地获取 transcript。

格式转换

收藏 0GitHub 13.2k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可借助内置的 baoyu-fetch CLI，将在线 URL 转为 Markdown，支持 Chrome CDP、站点适配器以及通用回退方案。适合在安装前了解 Bun 运行时要求、首次使用所需的 EXTEND.md 配置，以及处理 X、YouTube、Hacker News 和需渲染页面时的具体用法。

格式转换

收藏 0GitHub 13.2k

baoyu-markdown-to-html

作者 JimLiu

baoyu-markdown-to-html 可将 Markdown 转换为适合微信排版风格的样式化 HTML。它支持主题、代码高亮、数学公式、PlantUML、脚注、图片处理，以及可选的链接引用，并可通过 bun 或 `npx -y bun` 在运行时执行。

格式转换

收藏 0GitHub 13.2k

baoyu-format-markdown

作者 JimLiu

baoyu-format-markdown 可将纯文本或杂乱的 Markdown 整理为更干净、适合发布的 Markdown，同时尽量保留原意。它会修复 frontmatter、标题、列表、代码块、引用以及中日韩文字间距，因此很适合用于 Format Conversion，而不是改写内容。

格式转换

收藏 0GitHub 13.2k

baoyu-danger-x-to-markdown

作者 JimLiu

baoyu-danger-x-to-markdown 可将 X 的帖子、线程以及部分文章转换为带 YAML front matter 的 Markdown。它通过 `scripts/` 中的脚本配合 `bun` 或 `npx -y bun` 运行，支持基于 cookie 的访问与 consent 流程；相比通用提示词，更适合需要稳定复用的 Format Conversion 工作流。

格式转换

收藏 0GitHub 13.2k

dummy-dataset

作者 phuryn

dummy-dataset 可生成逼真的测试数据，输出为 CSV、JSON、SQL 或 Python 脚本格式。它通过让你定义列、行数和约束条件，帮助制作模拟数据集、演示样例、数据库初始化数据、QA 测试数据以及数据清洗用的示例记录。

数据清洗

收藏 0GitHub 11.1k

web-to-markdown

作者 softaworks

web-to-markdown 是一项用于格式转换的 skill，可通过本地 `web2md` CLI 将在线网页转换为干净的 Markdown；对于 JS 渲染页面、交互式流程和批量 URL 转换，则会配合 Chromium 系浏览器完成处理。它只会在被用户明确点名时运行。

格式转换

收藏 0GitHub 1.3k

speech-to-text

作者 NoizAI

speech-to-text 技能可将受支持的音频文件转写为纯文本，并支持时间戳、说话人标签和 JSON 输出。它面向需要稳定、可重复流程的实际 speech-to-text 场景，适用于访谈、会议、播客、讲座，以及对转写一致性要求较高的自动化任务。

工作流自动化

收藏 0GitHub 498

read-file

作者 duckdb

read-file 帮助代理使用 DuckDB 读取和检查 CSV、JSON、Parquet、Avro、Excel、SQLite、空间文件或远程 URL。可用于预览行、查看 schema、分析数据，并回答“这个文件里有什么”。它更适合读取真实数据制品，不适合源代码。

办公文档

收藏 0GitHub 443

transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿，或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换

收藏 0GitHub 23

tzst

作者 xixu-me

tzst 是一项面向 CLI 的技能，用于安装、创建、列出、测试和解压 `.tzst` 或 `.tar.zst` 归档，并提供合适的命令、参数与更安全的默认用法。适用于 tzst 安装、tzst 用法、过滤、冲突处理、流式处理以及 File Automation 工作流。

文件自动化

收藏 0GitHub 6

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

pdf

作者 K-Dense-AI

pdf skill 是一份实用的 PDF 处理指南，适合在工作流中需要读取、提取、转换或创建 PDF 文件时使用。它涵盖文本提取、合并、拆分、旋转、表单填充、加密、图像提取，以及扫描版 PDF 的 OCR。当你需要一份可重复使用的 pdf 指南，而不是一次性提示词时，它尤其合适。

PDF 处理

收藏 0GitHub 0

markitdown

作者 K-Dense-AI

markitdown 可将文件和办公文档转换为 Markdown，便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写，是一份实用的 markitdown 格式转换指南。

格式转换

收藏 0GitHub 0

transform-remove-background-with-transloadit

作者 transloadit

transform-remove-background-with-transloadit 是一项专注的图片编辑技能，使用官方 `@transloadit/node` CLI 删除本地图片背景，并保存为透明 PNG。它采用最简的 `/image/bgremove` steps 文件、明确的输入输出路径，以及清晰的凭据查找方式，让你更少猜测就能跑通整个工作流。

图像编辑

收藏 0GitHub 0

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

minimax-xlsx

作者 MiniMax-AI

minimax-xlsx 技能可帮助你以 Excel 优先的工作流创建、读取、编辑、验证和格式化 Excel 工作簿。适用于需要保留公式、样式、工作表布局和工作簿行为的结构化文件处理场景。它支持 .xlsx、.xlsm、.csv 和 .tsv 任务，包括分析、新建工作簿、最小侵入式编辑、公式修复和校验。minimax-xlsx 指南面向真实工作簿交付，而不是扁平表格。

电子表格工作流

收藏 0GitHub 0

pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中，使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法，以及面向文档准确性的实用 pdf 指南时使用。

PDF 处理

收藏 0GitHub 0

格式转换

浏览 数据处理 下与 格式转换 相关的 Agent Skill，并比较相近工作流、工具与使用场景。

浏览数据处理下与格式转换相关的 Agent Skill，并比较相近工作流、工具与使用场景。