格式转换

浏览 数据处理 下与 格式转换 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

18 个技能
A
nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能,基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印,并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理
收藏 0GitHub 156.2k
A
xlsx

作者 anthropics

xlsx skill 适合在交付物必须是电子表格时,让智能体读取、编辑、修复、创建并转换 .xlsx、.xlsm、.csv 和 .tsv 文件。它尤其擅长保留模板的更新、尽量不破坏公式的工作簿编辑、杂乱表格清洗,以及借助仓库脚本完成打包、校验和重算的实用电子表格工作流。

电子表格工作流
收藏 0GitHub 105.1k
A
pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务,包括文本提取、合并与拆分、页面渲染为图片,以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据,并通过脚本验证不可填写表单的版式。

PDF 处理
收藏 0GitHub 105.1k
K
defuddle

作者 kepano

defuddle 可通过 Defuddle CLI 从网页中提取干净的 markdown,去除页面杂项,适合研究、文档整理和文章采集。适用于常规 HTML 页面,可通过 npm 安装;对于以 .md 结尾的 URL 则不建议使用。

Web 研究
收藏 0GitHub 19.7k
K
json-canvas

作者 kepano

json-canvas 可帮助创建和编辑有效的 .canvas 文件,用于 Obsidian 风格的看板,正确处理节点、边、ID、坐标、分组和引用等结构。

图表绘制
收藏 0GitHub 19.7k
J
baoyu-youtube-transcript

作者 JimLiu

baoyu-youtube-transcript 可从 YouTube URL 或 video ID 提取 transcript、subtitles 和封面图。它支持语言选择、翻译、Markdown 或 SRT 输出、基于缓存的重新格式化,并在 InnerTube API 不可用时回退到 yt-dlp,以更稳定地获取 transcript。

格式转换
收藏 0GitHub 13.2k
J
baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可借助内置的 baoyu-fetch CLI,将在线 URL 转为 Markdown,支持 Chrome CDP、站点适配器以及通用回退方案。适合在安装前了解 Bun 运行时要求、首次使用所需的 EXTEND.md 配置,以及处理 X、YouTube、Hacker News 和需渲染页面时的具体用法。

格式转换
收藏 0GitHub 13.2k
J
baoyu-markdown-to-html

作者 JimLiu

baoyu-markdown-to-html 可将 Markdown 转换为适合微信排版风格的样式化 HTML。它支持主题、代码高亮、数学公式、PlantUML、脚注、图片处理,以及可选的链接引用,并可通过 bun 或 `npx -y bun` 在运行时执行。

格式转换
收藏 0GitHub 13.2k
J
baoyu-format-markdown

作者 JimLiu

baoyu-format-markdown 可将纯文本或杂乱的 Markdown 整理为更干净、适合发布的 Markdown,同时尽量保留原意。它会修复 frontmatter、标题、列表、代码块、引用以及中日韩文字间距,因此很适合用于 Format Conversion,而不是改写内容。

格式转换
收藏 0GitHub 13.2k
J
baoyu-danger-x-to-markdown

作者 JimLiu

baoyu-danger-x-to-markdown 可将 X 的帖子、线程以及部分文章转换为带 YAML front matter 的 Markdown。它通过 `scripts/` 中的脚本配合 `bun` 或 `npx -y bun` 运行,支持基于 cookie 的访问与 consent 流程;相比通用提示词,更适合需要稳定复用的 Format Conversion 工作流。

格式转换
收藏 0GitHub 13.2k
P
dummy-dataset

作者 phuryn

dummy-dataset 可生成逼真的测试数据,输出为 CSV、JSON、SQL 或 Python 脚本格式。它通过让你定义列、行数和约束条件,帮助制作模拟数据集、演示样例、数据库初始化数据、QA 测试数据以及数据清洗用的示例记录。

数据清洗
收藏 0GitHub 11.1k
S
web-to-markdown

作者 softaworks

web-to-markdown 是一项用于格式转换的 skill,可通过本地 `web2md` CLI 将在线网页转换为干净的 Markdown;对于 JS 渲染页面、交互式流程和批量 URL 转换,则会配合 Chromium 系浏览器完成处理。它只会在被用户明确点名时运行。

格式转换
收藏 0GitHub 1.3k
D
read-file

作者 duckdb

read-file 帮助代理使用 DuckDB 读取和检查 CSV、JSON、Parquet、Avro、Excel、SQLite、空间文件或远程 URL。可用于预览行、查看 schema、分析数据,并回答“这个文件里有什么”。它更适合读取真实数据制品,不适合源代码。

办公文档
收藏 0GitHub 443
R
transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿,或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换
收藏 0GitHub 23
X
tzst

作者 xixu-me

tzst 是一项面向 CLI 的技能,用于安装、创建、列出、测试和解压 `.tzst` 或 `.tar.zst` 归档,并提供合适的命令、参数与更安全的默认用法。适用于 tzst 安装、tzst 用法、过滤、冲突处理、流式处理以及 File Automation 工作流。

文件自动化
收藏 0GitHub 6
K
kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取,支持 91+ 种格式,包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流,适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理
收藏 0GitHub 0
M
minimax-xlsx

作者 MiniMax-AI

minimax-xlsx 技能可帮助你以 Excel 优先的工作流创建、读取、编辑、验证和格式化 Excel 工作簿。适用于需要保留公式、样式、工作表布局和工作簿行为的结构化文件处理场景。它支持 .xlsx、.xlsm、.csv 和 .tsv 任务,包括分析、新建工作簿、最小侵入式编辑、公式修复和校验。minimax-xlsx 指南面向真实工作簿交付,而不是扁平表格。

电子表格工作流
收藏 0GitHub 0
O
pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中,使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法,以及面向文档准确性的实用 pdf 指南时使用。

PDF 处理
收藏 0GitHub 0
格式转换 Agent Skill