nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

Stars156.2k

收录时间2026年4月15日

分类PDF 处理

安装命令

npx skills add affaan-m/everything-claude-code --skill nutrient-document-processing

编辑评分

该技能评分为 78/100，属于目录里比较值得收录的候选：它具备清晰的文档处理能力、具体的 API 调用示例，以及足够的操作细节，能比通用提示减少很多猜测。但用户仍需自行提供 Nutrient API key，并自行处理商业 API 的使用条款。

78/100

亮点

明确列出了可触发的工作流：转换、OCR、提取、编辑脱敏、签名和填写文档。
提供了具体的 curl 示例，以及 multipart 请求所需的 Nutrient API 端点/模式。
覆盖了多种常见文档类型（PDF、DOCX、XLSX、PPTX、HTML、图片），适用范围广。

注意点

未提供安装命令或配套文件，因此接入时需要手动配置 API key 和请求流程。
该技能更偏向 API 集成，而非可自主执行的 agent；用户必须已经能够访问商业版 Nutrient 服务。

PDF DOCX XLSX Pptx OCR Redaction Signing

概览

nutrient-document-processing 技能概览

nutrient-document-processing 能做什么

nutrient-document-processing 技能可帮助你调用 Nutrient DWS Processor API，对文档进行转换、OCR、提取、脱敏、签名、加水印和填表。它最适合需要实用型 nutrient-document-processing 来完成 PDF Processing 工作流的用户，而不是只想要一个泛泛的“编辑文档”提示词。

谁应该使用它

如果你的任务属于文档自动化，就适合用这个技能：把 DOCX/XLSX/PPTX/HTML 转成 PDF，提取文本或表格，对扫描件做 OCR，或者生成符合合规要求的输出，比如已脱敏或已签名文件。它最适合结果必须可复现、并且由 API 驱动，而不是人工编辑的场景。

安装前需要先确认什么

这个技能的核心采用门槛在于：它集成的是商业 API，因此你需要有效的 API key，并接受把文档发送到外部服务。只有当你已经明确输入文件类型、期望输出格式，以及任务是否需要 OCR、脱敏或签名时，这个技能的效果才最强。

如何使用 nutrient-document-processing 技能

安装并完成认证

先把 nutrient-document-processing 技能安装到你的 skills workspace，然后在运行任何请求前设置 API key：

export NUTRIENT_API_KEY="pdf_live_..."

在执行 nutrient-document-processing install 这一步之前，请确认你的环境能够安全保存密钥，并且允许向 https://api.nutrient.io/build 发起外部请求。

从输入出发，不要从功能出发

一条高质量的 nutrient-document-processing usage 提示词，会在一句话里同时写清源文件、目标输出和转换类型。例如：“将 invoice.docx 转为 PDF，保留版式，并返回单个文件”，或者“对这个扫描版 PDF 做 OCR，并把表格数据提取成结构化文本”。这种具体度能减少猜测，也能避免得到含糊、分多步的输出。

先读这些文件

先查看 skills/nutrient-document-processing 里的 SKILL.md，再阅读任何会影响你环境行为的关联仓库上下文。由于这个 repo 没有额外的 rules/、resources/ 或辅助脚本，最重要的是理解 API 合约、支持的输入类型，以及 skill 正文中展示的精确 multipart 请求格式。

真正好用的工作流

先用一个小测试文档验证结果类型，再扩展到批量或敏感文件。把操作和真实任务对应起来：格式变更用 convert，扫描 PDF 用 OCR，文本/表格捕获用 extract，PII 删除用 redact，信任流程用 sign，表单填写用 fill。如果你的第一版提示词不够明确，就把“完成标准”直接写出来，比如“保留原始版式”“返回可搜索文本”或“删除第 3 页上的所有 SSN 和姓名”。

nutrient-document-processing 技能常见问题

nutrient-document-processing 只适用于 PDF 吗？

不是。nutrient-document-processing skill 支持 PDF，以及 DOCX、XLSX、PPTX、HTML 和图片等常见办公文档/图像输入，不过在很多工作流里，PDF 是主要的下游格式。

我必须已经是 API 用户吗？

不一定，但你需要能接受提供 API key 并处理文件上传。如果你想要的是完全本地、没有外部服务的提示词方案，这个技能大概率不适合你。

这和直接让模型“转换文档”有什么不同？

普通提示词也能描述任务，但这个技能提供的是一个有具体 API 支撑的工作流，上传格式、endpoint 和输出行为都更明确。当输出保真度、可重复性和文件处理方式比一次性的文字建议更重要时，这一点就很关键。

它适合新手吗？

如果你已经知道源文件和目标格式，那它是适合新手的。对于需求不明确的文档任务，它就没那么友好，因为最佳结果取决于选对操作，并给出清晰的输出要求。

如何改进 nutrient-document-processing 技能

把 API 用在最合适的任务上

最大的改进空间在于：选择与你目标最匹配、粒度最窄的操作。比如，只有在源文件是扫描件时才做 OCR；只有在需要删除特定数据时才做 redact；只有在输出格式需要变化时才做 convert。这样能让 nutrient-document-processing guide 更贴合真实工作。

事先说明文档约束

在第一次请求里就写明页码范围、语言、敏感级别和版式预期。好的输入可以像这样：“对这份 12 页的英文扫描 PDF 做 OCR，并保留标题层级”，或者“把附件 PDF 里的所有邮箱地址和电话号码脱敏，然后返回干净的 PDF”。像“帮我修一下这个文档”这类弱输入会迫使系统做过多猜测。

先检查首个输出里的失败模式

常见问题包括版式漂移、低质量扫描件 OCR 不完整，以及脱敏或提取范围过宽。如果第一次结果不理想，应该通过补充文件类型、目标格式和保留规则来收紧提示词，而不是把同样的请求再说一遍。

用小样本测试来提升结果

在处理敏感或高吞吐任务之前，先用一个有代表性的小样本文件测试 nutrient-document-processing 技能。等工作流确认正确后，再沿用同样的提示词结构处理完整批次，这样输出质量更稳定，也更容易验证。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取，也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取

收藏 0GitHub 2.3k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence，从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导，便于进行可靠的文档分析。

OCR 提取

收藏 0GitHub 2.2k

nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流，用于转换、合并、拆分、OCR、提取、脱敏、签署、优化，以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理

收藏 0GitHub 0

pdf

作者 ComposioHQ

pdf skill 面向 PDF Processing 工作流：可通过 SKILL.md、forms.md、reference.md 以及辅助脚本提取文本和元数据、拆分或合并文件、渲染页面、创建 PDF，并填写表单。

PDF 处理

收藏 0GitHub 67.5k

visa-doc-translate

作者 affaan-m

visa-doc-translate 可将签证申请文件图片翻译成英文，并生成包含原页与译文的双语 PDF。它面向结构化签证材料，支持 OCR 兜底、旋转处理，并尽量保留姓名、日期和金额等关键信息。

翻译

收藏 0GitHub 156.3k

hv-analysis

作者 KKKKhazix

hv-analysis 是一项横向-纵向研究技能，可将产品、公司、概念、技术或个人转化为结构化分析报告。适合用于深度研究、竞品比较和可直接交付的报告输出，尤其是在你需要用 hv-analysis 做 Data Analysis 或打磨成 PDF 工作流时。

数据分析

收藏 0GitHub 9k

azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取，并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致，适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取

收藏 0GitHub 2.2k

markitdown

作者 K-Dense-AI

markitdown 可将文件和办公文档转换为 Markdown，便于阅读、分块、检索和 LLM 工作流。这个 markitdown 技能支持 PDF、DOCX、PPTX、XLSX、HTML、CSV、JSON、XML、ZIP、EPUB、带 OCR 的图片以及音频转写，是一份实用的 markitdown 格式转换指南。

格式转换

收藏 0GitHub 0

analyzing-malicious-pdf-with-peepdf

作者 mukul975

analyzing-malicious-pdf-with-peepdf 是一项面向可疑 PDF 的静态恶意软件分析技能。可使用 peepdf、pdfid 和 pdf-parser 对钓鱼附件进行初步研判，检查对象，提取内嵌 JavaScript 或 shellcode，并在不执行文件的情况下安全审查可疑流。

恶意软件分析

收藏 0GitHub 0

analyzing-pdf-malware-with-pdfid

作者 mukul975

analyzing-pdf-malware-with-pdfid 是一个用于 PDF 恶意代码初筛的技能，可在打开文件前检测嵌入式 JavaScript、利用特征标记、对象流、附件以及可疑行为。它支持用于恶意 PDF 取证、事件响应，以及 Security Audit 工作流中的静态分析。

安全审计

收藏 0GitHub 0

pdf

作者 openai

在涉及版式、分页和渲染结果的 PDF 处理任务中，使用 pdf skill。它支持你以“先渲染、再检查、后调整”的可视化优先流程来读取、创建、编辑和审阅 PDF。适合需要可靠的 PDF 安装、pdf 用法，以及面向文档准确性的实用 pdf 指南时使用。

PDF 处理

收藏 0GitHub 0

pdf

作者 K-Dense-AI

pdf skill 是一份实用的 PDF 处理指南，适合在工作流中需要读取、提取、转换或创建 PDF 文件时使用。它涵盖文本提取、合并、拆分、旋转、表单填充、加密、图像提取，以及扫描版 PDF 的 OCR。当你需要一份可重复使用的 pdf 指南，而不是一次性提示词时，它尤其合适。

PDF 处理

收藏 0GitHub 0

Resume Formatter

作者 Paramchoudhary

Resume Formatter 可将杂乱的简历整理为清晰、适配 ATS 的文档，强调层次分明、留白均衡和专业结构。它适合用于 Resume Formatter、求职申请以及需要在屏幕和纸面上都保持易读性的简历重设计。

简历写作

收藏 0GitHub 443