pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中，使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法，以及面向文档准确性的实用 pdf 指南时使用。

Stars0

收录时间2026年5月8日

分类PDF 处理

安装命令

npx skills add openai/skills --skill pdf

编辑评分

这个 skill 的评分是 78/100，说明它足够实用，适合作为目录中的候选项，尤其适合 PDF 密集型任务。对目录用户来说，它在创建、读取和审阅等工作流中触发性较强、也比较实用，但还没有完善到可以完全消除安装或环境上的不确定性。

78/100

亮点

触发条件和适用范围清晰，聚焦于版式很重要的 PDF 阅读、创建和审阅场景。
工作流指导具体：先渲染页面做可视化检查，生成时用 reportlab，提取时用 pdfplumber/pypdf。
包含操作约定和依赖说明，能帮助 agent 减少试错成本、提高执行确定性。

注意点

SKILL.md 里没有安装命令，用户可能需要手动处理依赖。
依赖说明被截断，且存在占位标记，说明文档并不完整，在边缘场景下可能会降低可信度。

PDF Python 报告制作

概览

pdf 技能概览

pdf 技能能做什么

pdf 技能适用于 PDF Processing 任务，重点是版式、分页和最终渲染效果，而不只是纯文本抽取。当你需要以可核对的流程去阅读、创建或审阅 PDF，而不是只丢给一个泛化提示词时，它就很有用。

适合谁安装

如果你经常处理报告、表单、生成文档，或者任何在打开后很在意外观的 PDF，就应该安装 pdf。对于需要以编程方式创建 PDF、验证分页位置，或把抽取文本与渲染结果做对比的 agent，它尤其合适。

它为什么不一样

它最大的差异点在于以视觉为先的工作流：先渲染页面，检查结果，再做调整。对于 PDF Processing 来说，这往往就是“技术上可用”和“真正能用”之间的区别。这个技能还会把你引向 reportlab、pdfplumber 和 pypdf 这类实用的 Python 工具，而不是把实现路径留得很空。

如何使用 pdf 技能

安装 pdf 并确认适用范围

使用 npx skills add openai/skills --skill pdf 安装 pdf 技能。适合在任务明确与 PDF 创建、审阅或抽取有关，且格式一旦出问题就会影响结果时使用。如果你的任务只是概括一份文档的文字内容，而且不关心版式，普通提示词可能就够了。

先看对文件

先读 SKILL.md，再查看 agents/openai.yaml 里的默认提示词和意图。如果你是在更大的 repo 里使用这个技能，在开始前也要先扫一遍文件树，看看有没有 PDF 专用的辅助脚本或输出约定。当前这个精选包很轻量，所以它的核心价值在于认真遵循工作流，而不是去找很多额外资源。

让提示词更适合 PDF 输出

给技能一个明确的结果、页数、源材料和任何版式约束。好的输入示例像是：“创建一个 2 页 PDF 发票，包含简洁表格、logo 占位符和统一边距”，或者“导出后检查这个 PDF 是否存在裁切、间距问题和缺页内容”。像“把这个 PDF 做得更好”这种模糊输入会迫使模型猜测，通常只会得到浅层结果。

使用渲染检查循环

对于 PDF Processing，不要停在文本抽取这一步。先生成或编辑文件，如果条件允许，用 Poppler 把页面渲染成图片，再检查对齐、间距和可读性。当你要求修改时，要明确指出视觉上哪里失败了：标题被截断、文本重叠、分页不合理，或者表格溢出页边距。

pdf 技能常见问题

pdf 适合 PDF Processing，还是只适合文本抽取？

它面向的是更广义的 PDF Processing：阅读、生成和审阅 PDF，最终渲染后的页面效果才是重点。这个技能确实支持抽取工具，但它明确提醒你，不要只靠抽取结果来判断版式是否正确。

如果我已经会写通用提示词，还需要这个技能吗？

如果任务很简单，也许不需要。只有当你想要一个可复用的工作流，里面包含渲染检查、依赖说明，以及更清晰的 PDF 文件处理方式时，才更值得安装 pdf 技能。它能降低“内容读起来对了，但样子错了”这种交付风险。

pdf 技能适合新手吗？

适合，只要你能描述自己想要的文档，并愿意检查输出。工作流本身并不复杂：安装、读 SKILL.md、生成或编辑、渲染、验证、迭代。新手最常见的错误，是跳过渲染这一步，并默认文本工具就足够了。

什么时候不该用 pdf 技能？

如果任务不依赖 PDF 版式，或者你的环境无法安装渲染依赖、你也没法本地检查结果，就不该用它。对于那些不涉及真实 PDF 文件、只需要一次性文字回答的问题，它的作用也比较有限。

如何改进 pdf 技能

给技能加入页面级约束

要想在 PDF Processing 上拿到更好的结果，最有效的办法是把结构约束说清楚：页面大小、页数、页边距、字体、表格预期，以及输出是否必须兼顾打印或屏幕阅读。如果你知道文档更像表单、报告还是演示稿，最好尽早说明。

反馈视觉失败，而不只是报错

拿到第一版输出后，要用渲染层面的语言说明问题。比如：“第 2 页页脚和正文重叠了”、“表格表头重复方式不对”或者“最后一段被底部边距裁掉了”。这类信息比“修一下格式”更有可操作性。

以可用的形式提供源材料

如果任务是重建或编辑 PDF，尽量把原始文本、图片或源数据单独提供出来。对 PDF Processing 来说，输入越干净，OCR 噪声、抽取歧义和版式漂移就越少。如果你手头只有 PDF 本身，也要说明目标是忠实复刻、可读抽取，还是重新设计。

通过明确的输出目标迭代

当每一轮只聚焦一个目标时，这个技能进步最快：可读性、保真度、文件大小，或是否适合打印。如果你希望 pdf 技能下一轮做得更好，就把提示词收窄，并明确指出最重要的页码或章节。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取，也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取

收藏 0GitHub 2.3k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence，从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导，便于进行可靠的文档分析。

OCR 提取

收藏 0GitHub 2.2k

nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流，用于转换、合并、拆分、OCR、提取、脱敏、签署、优化，以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理

收藏 0GitHub 0

visa-doc-translate

作者 affaan-m

visa-doc-translate 可将签证申请文件图片翻译成英文，并生成包含原页与译文的双语 PDF。它面向结构化签证材料，支持 OCR 兜底、旋转处理，并尽量保留姓名、日期和金额等关键信息。

翻译

收藏 0GitHub 156.3k

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

hv-analysis

作者 KKKKhazix

hv-analysis 是一项横向-纵向研究技能，可将产品、公司、概念、技术或个人转化为结构化分析报告。适合用于深度研究、竞品比较和可直接交付的报告输出，尤其是在你需要用 hv-analysis 做 Data Analysis 或打磨成 PDF 工作流时。

数据分析

收藏 0GitHub 9k

azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取，并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致，适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取

收藏 0GitHub 2.2k

markitdown

作者 K-Dense-AI

markitdown 可将文件和办公文档转换为 Markdown，便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写，是一份实用的 markitdown 格式转换指南。

格式转换

收藏 0GitHub 0

analyzing-malicious-pdf-with-peepdf

作者 mukul975

analyzing-malicious-pdf-with-peepdf 是一项面向可疑 PDF 的静态恶意软件分析技能。可使用 peepdf、pdfid 和 pdf-parser 对钓鱼附件进行初步研判，检查对象，提取内嵌 JavaScript 或 shellcode，并在不执行文件的情况下安全审查可疑流。

恶意软件分析

收藏 0GitHub 0

analyzing-pdf-malware-with-pdfid

作者 mukul975

analyzing-pdf-malware-with-pdfid 是一个用于 PDF 恶意代码初筛的技能，可在打开文件前检测嵌入式 JavaScript、利用特征标记、对象流、附件以及可疑行为。它支持用于恶意 PDF 取证、事件响应，以及 Security Audit 工作流中的静态分析。

安全审计

收藏 0GitHub 0

pdf

作者 K-Dense-AI

pdf skill 是一份实用的 PDF 处理指南，适合在工作流中需要读取、提取、转换或创建 PDF 文件时使用。它涵盖文本提取、合并、拆分、旋转、表单填充、加密、图像提取，以及扫描版 PDF 的 OCR。当你需要一份可重复使用的 pdf 指南，而不是一次性提示词时，它尤其合适。

PDF 处理

收藏 0GitHub 0

Resume Formatter

作者 Paramchoudhary

Resume Formatter 可将杂乱的简历整理为清晰、适配 ATS 的文档，强调层次分明、留白均衡和专业结构。它适合用于 Resume Formatter、求职申请以及需要在屏幕和纸面上都保持易读性的简历重设计。

简历写作

收藏 0GitHub 443

minimax-pdf

作者 MiniMax-AI

minimax-pdf 技能可帮助你在重视视觉质量和文档一致性的场景下创建、填充或重排精美 PDF。它适用于 CREATE、FILL 或 REFORMAT 工作流，采用基于 token 的设计系统，把粗糙输入转成可直接印刷的输出。本指南涵盖 minimax-pdf 的安装、使用方法，以及如何选择合适的路由以获得更好结果。

PDF 处理

收藏 0GitHub 0