pdf

作者 K-Dense-AI

pdf skill 是一份实用的 PDF 处理指南，适合在工作流中需要读取、提取、转换或创建 PDF 文件时使用。它涵盖文本提取、合并、拆分、旋转、表单填充、加密、图像提取，以及扫描版 PDF 的 OCR。当你需要一份可重复使用的 pdf 指南，而不是一次性提示词时，它尤其合适。

Stars0

收录时间2026年5月14日

分类PDF 处理

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill pdf

编辑评分

这个 skill 得分 76/100，属于目录中表现扎实但不算惊艳的条目：它提供了一个可明确触发的、聚焦 PDF 的 skill，并包含真实的工作流内容；但在部分操作上，用户仍需要依赖关联的内部文档和已有的 Python 基础。仓库里的证据足以支持为经常处理 PDF 的 agent 安装，尤其适合用户希望获得明确 PDF 处理能力，而不是泛泛的提示词时。

76/100

亮点

触发性很强：frontmatter 明确写到，只要用户想对 PDF 文件做任何事情——包括阅读、合并、拆分、OCR、表单和加密——都应使用这个 skill。
操作内容充实：SKILL.md 正文篇幅很大（7,511 字符），并包含大量标题和工作流章节，说明它不是一个占位文件。
对 agent 很实用：quick-start 代码和具体的 pypdf 示例，为常见 PDF 任务提供了可直接执行的路径。

注意点

没有 install 命令、脚本或配套文件，因此用户可能需要自行整理依赖并查阅后续文档。
摘录中提到了 reference.md 和 forms.md，但这些文件并未出现在仓库证据里，这会降低逐步披露的确定性。

PDF OCR Python Cli File Automation

概览

pdf 技能概览

pdf 技能适合做什么

pdf 技能是一份实用的 PDF Processing 指南，适合在你需要以可落地的工作流去读取、提取、转换或创建 PDF 文件时使用。它尤其适合处理常见文档任务，例如文本提取、合并、拆分、旋转、表单填写、加密、图片提取，以及针对扫描版 PDF 的 OCR。

适合安装给谁

如果你经常在自动化、数据提取、报告生成或支持工具中处理文档，建议安装 pdf 技能。它特别适合需要可重复方法，而不是一次性提示词的场景；也适合那些必须按顺序完成多个 PDF 步骤的任务。

它为什么有用

pdf 技能的核心价值在于，它聚焦的是实际的 PDF 工作流，而不是泛泛而谈的答案。它会给你清晰的路径，帮助你选择库、区分扫描版 PDF 和文本型 PDF，并避免常见错误，比如把表单字段交给错误的工具处理，或者在文本已经存在时误以为必须做 OCR。

如何使用 pdf 技能

安装 pdf 技能

先按这个 repo 的技能安装流程安装，然后直接打开技能源文件：
scientific-skills/pdf/SKILL.md

如果你的环境支持，仓库里给出的安装命令是：
npx skills add K-Dense-AI/claude-scientific-skills --skill pdf

先给技能正确的输入

pdf 的最佳用法，始于一个明确的目标、文件类型和输出格式。要说明这个 PDF 是什么、你想让它做什么，以及有哪些限制。例如：“把一份 40 页的扫描版 PDF 里的表格提取成 CSV”，或者“合并这三个 PDF，保持页码顺序，并尽可能保留书签”。

先读对的部分

先看 SKILL.md 里的工作流；如果任务涉及更高级的操作或表单填写，再查看其中链接的配套文件，比如 reference.md 或 forms.md。最快的做法，是先把你的任务对应到准确的章节，再开始写代码。

使用任务化提示词

更强的提示词能给技能足够上下文，帮助它选对方法：

输入文件类型：文本型 PDF 还是扫描版 PDF
目标：提取、合并、拆分、脱敏、签名、OCR 或创建
输出：PDF、文本、CSV、JSON 或图片
约束：保留版式、保留元数据、批量处理，或避免付费工具

示例：“使用 pdf 技能对扫描版发票做 OCR，提取供应商名称、日期和总金额，并返回结构化 JSON。优先使用开源 Python 库，并保持每个字段对应的页码。”

pdf 技能常见问题

pdf 技能只能用来读 PDF 吗？

不是。pdf 技能覆盖的是整个 PDF Processing 过程，包括提取、编辑、创建和转换等任务。如果你的工作只是读取文本，流程会更简单；如果你的工作还包括合并、拆分、表单或 OCR，这个技能就更有价值。

什么时候不该用 pdf 技能？

如果你的任务只是手动打开一个单独的 PDF，那么完整技能可能没必要。它也不太适合那些本质上不是 PDF 问题的场景，比如需要对图片进行 OCR、进行 Office 文档转换，或者仓库范围之外的复杂桌面签名流程。

pdf 技能会替代普通提示词吗？

通常会比普通提示词更可靠，因为它提供了可重复的安装和使用路径。泛化提示词可以回答单个 PDF 问题，但当你需要稳定结果、可复用步骤，或者后续还会再次运行的代码时，pdf 指南更合适。

对新手友好吗？

友好，只要你有清晰目标。新手通常最适合从一个任务、一种文件类型和一种输出开始。真正的阻碍通常是输入太模糊，而不是技术背景不够。

如何改进 pdf 技能

把第一次请求写具体

最好的结果来自对 PDF 任务的精确命名。“提取所有表格”不如“把扫描版 PDF 第 3 到 12 页的表格提取为 CSV，保持行顺序，并标注任何无法识别的单元格”。目标越明确，技能需要猜测的地方就越少。

说明关键的 PDF 约束

告诉技能文件是扫描版、加密、基于表单、体积很大，还是图片密集。这些细节会改变 PDF Processing 的实现路径，也能避免在文本提取、OCR 或编辑方面做出错误假设。

对照真实文档检查输出

第一次运行后，把结果和源 PDF 对照，检查是否有缺页、阅读顺序错乱、列合并错误，或者表单值丢失。如果有问题，不要只要求更大范围重跑，而是把失败模式写进提示词里。

结合最终格式迭代

如果你需要代码，就要求输出与你的运行时和库匹配的代码。如果你需要数据，就明确 schema。如果你需要最终 PDF，就说明你最在意的是版式保真、书签、批注，还是文本可搜索性。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取，也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取

收藏 0GitHub 2.3k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence，从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导，便于进行可靠的文档分析。

OCR 提取

收藏 0GitHub 2.2k

nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流，用于转换、合并、拆分、OCR、提取、脱敏、签署、优化，以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理

收藏 0GitHub 0

visa-doc-translate

作者 affaan-m

visa-doc-translate 可将签证申请文件图片翻译成英文，并生成包含原页与译文的双语 PDF。它面向结构化签证材料，支持 OCR 兜底、旋转处理，并尽量保留姓名、日期和金额等关键信息。

翻译

收藏 0GitHub 156.3k

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

hv-analysis

作者 KKKKhazix

hv-analysis 是一项横向-纵向研究技能，可将产品、公司、概念、技术或个人转化为结构化分析报告。适合用于深度研究、竞品比较和可直接交付的报告输出，尤其是在你需要用 hv-analysis 做 Data Analysis 或打磨成 PDF 工作流时。

数据分析

收藏 0GitHub 9k

azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取，并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致，适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取

收藏 0GitHub 2.2k

markitdown

作者 K-Dense-AI

markitdown 可将文件和办公文档转换为 Markdown，便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写，是一份实用的 markitdown 格式转换指南。

格式转换

收藏 0GitHub 0

analyzing-malicious-pdf-with-peepdf

作者 mukul975

analyzing-malicious-pdf-with-peepdf 是一项面向可疑 PDF 的静态恶意软件分析技能。可使用 peepdf、pdfid 和 pdf-parser 对钓鱼附件进行初步研判，检查对象，提取内嵌 JavaScript 或 shellcode，并在不执行文件的情况下安全审查可疑流。

恶意软件分析

收藏 0GitHub 0

analyzing-pdf-malware-with-pdfid

作者 mukul975

analyzing-pdf-malware-with-pdfid 是一个用于 PDF 恶意代码初筛的技能，可在打开文件前检测嵌入式 JavaScript、利用特征标记、对象流、附件以及可疑行为。它支持用于恶意 PDF 取证、事件响应，以及 Security Audit 工作流中的静态分析。

安全审计

收藏 0GitHub 0

pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中，使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法，以及面向文档准确性的实用 pdf 指南时使用。

PDF 处理

收藏 0GitHub 0

Resume Formatter

作者 Paramchoudhary

Resume Formatter 可将杂乱的简历整理为清晰、适配 ATS 的文档，强调层次分明、留白均衡和专业结构。它适合用于 Resume Formatter、求职申请以及需要在屏幕和纸面上都保持易读性的简历重设计。

简历写作

收藏 0GitHub 443

minimax-pdf

作者 MiniMax-AI

minimax-pdf 技能可帮助你在重视视觉质量和文档一致性的场景下创建、填充或重排精美 PDF。它适用于 CREATE、FILL 或 REFORMAT 工作流，采用基于 token 的设计系统，把粗糙输入转成可直接印刷的输出。本指南涵盖 minimax-pdf 的安装、使用方法，以及如何选择合适的路由以获得更好结果。

PDF 处理

收藏 0GitHub 0