azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence，从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导，便于进行可靠的文档分析。

Stars2.2k

收录时间2026年5月7日

分类OCR 提取

安装命令

npx skills add microsoft/skills --skill azure-ai-document-intelligence-dotnet

编辑评分

该技能得分为 84/100，说明它很适合作为面向需要基于 .NET 的 Azure Document Intelligence 工作流用户的目录条目。仓库提供了足够的触发线索、安装步骤、身份验证/环境配置说明以及示例导向内容，代理通常可以较准确地判断何时使用它，并以比通用提示更少的猜测来执行。

84/100

亮点

明确给出了 Document Intelligence、发票提取、收据 OCR 和自定义模型的触发短语与使用场景。
安装和环境配置具体可落地，包括所需的包名以及 endpoint/API key 环境变量。
正文内容充实，包含多个标题、代码块和仓库/文件引用，足以支持真实工作流使用。

注意点

描述元数据非常短，因此安装决策主要依赖正文，而不是丰富的摘要信息。
缺少支持文件或补充参考资料，因此某些边界情况可能仍需要查看完整的 SKILL.md。

Azure Dotnet Csharp 微软 OCR PDF

概览

azure-ai-document-intelligence-dotnet 技能概览

这个技能能做什么

azure-ai-document-intelligence-dotnet 技能可以帮助你使用 Azure AI Document Intelligence SDK for .NET，从文档中提取文本、表格、键值对和结构化字段。它适合需要 OCR Extraction 加上带版面感知的文档分析，而不只是普通文本 OCR 的场景。azure-ai-document-intelligence-dotnet 技能尤其适合发票、收据、身份证件，以及需要把输出稳定交给后续代码处理的自定义文档模型。

适合谁使用

如果你正在构建一个会调用 Azure.AI.DocumentIntelligence 的 .NET 应用、agent 或脚本，并且想要一份实用的 azure-ai-document-intelligence-dotnet guide，而不是从零拼接认证和示例代码，那就适合用这个技能。它最适合已经知道要处理哪类文档、并且需要快速、准确完成安装和首次调用的工程师。

采用前先看什么

主要决策因素是 Azure 环境配置、认证方式，以及你的文档类型是否能匹配预置模型，还是需要自定义模型。这个技能默认你能提供 endpoint，并且根据认证方式提供 API key 或 Microsoft Entra 访问权限。如果你只需要通用 OCR，一个更轻量的提示词就可能够用；如果你需要用 .NET 做结构化抽取，这个技能会是更合适的起点。

如何使用 azure-ai-document-intelligence-dotnet 技能

先安装并验证包

如果是常规的 azure-ai-document-intelligence-dotnet install，就按技能里展示的方式添加 NuGet 包：Azure.AI.DocumentIntelligence 和 Azure.Identity。然后先确认你的项目目标 .NET 版本受支持，并且在发起文档调用之前能够加载 Azure 凭据。若包安装成功但认证失败，问题通常出在配置，而不是技能本身。

先给技能一个明确的抽取目标

最好的 azure-ai-document-intelligence-dotnet usage，一定会先说明文档类型、目标输出结构，以及你想用的认证方式。一个弱请求是：“从 PDF 里提取数据。” 一个更强的请求是：“用 .NET 中的 Azure.AI.DocumentIntelligence，通过 Entra 认证，从 PDF 文件里提取发票供应商名称、发票号、总金额和明细行。” 这样技能才有足够上下文去选择合适的模型和代码路径。

先读对源文件

先看 SKILL.md，里面有安装、环境变量和认证模式。然后再检查技能对应的仓库路径中的包使用示例，并留意关于 DocumentIntelligenceClient、DefaultAzureCredential 和模型选择的说明。如果你的场景要上线，尤其要关注环境变量名称，以及哪些值是必填、哪些是可选。

采用与真实应用一致的工作流

比较稳妥的流程是：安装包，设置 DOCUMENT_INTELLIGENCE_ENDPOINT，选择 API key 或 Entra 认证，先拿一个已知文档跑通预置模型，然后在基础调用稳定后再扩展到自定义抽取。对于 OCR Extraction 任务，最好先用一小批样本验证页分、表格和字段名是否正确，再把输出接进业务逻辑。

azure-ai-document-intelligence-dotnet 技能 FAQ

这只是 OCR 吗？

不是。azure-ai-document-intelligence-dotnet skill 覆盖的是 OCR 加结构化文档分析。如果你只需要原始文本，可能用得有些重；如果你需要表格、键值对或模型驱动字段，它就非常合适。

使用前必须先有 Azure 凭据吗？

是的，你需要有效的 Document Intelligence endpoint，以及根据所选认证流程准备 API key 或 Microsoft Entra 配置。如果你打算使用 DefaultAzureCredential，要确保本地环境和生产环境是有意做过区分的，而不是误配。

对初学者友好吗？

如果你已经会创建 .NET 项目并安装 NuGet 包，它是比较友好的。若你刚接触 Azure 认证，就没那么友好，因为真正难的通常是 endpoint 和凭据配置，而不是 SDK 调用本身。

什么情况下不该用这个技能？

如果你的任务与文档解析无关，或者你只是想要一个不需要任何集成工作的 PDF 自动摘要，那就不适合。若你还没决定文档来源、输出 schema 或部署环境，它也不是好选择。

如何改进 azure-ai-document-intelligence-dotnet 技能

说清文档类型和字段

提升效果最大的办法，是直接点明文档类别和你需要的准确字段。比如，不要只说“重要数据”，而是要明确要求发票总额、供应商名称、税额、日期和明细行。字段定义越清楚，提示词越好，抽取逻辑越干净，下游映射错误也越少。

提前说明认证和运行约束

如果你想用 Microsoft Entra 认证，就要在请求里直接说明，并注明代码必须在本地、CI 还是 Azure 中运行。azure-ai-document-intelligence-dotnet 技能在知道该展示 AzureKeyCredential、DefaultAzureCredential 还是生产可用模式时，效果最好。这样可以避免代码看起来正确，却在你的环境里跑不通。

先用一个真实样本验证，再考虑扩展

先选一份具有代表性的文档和一个模型方案，看看输出结构是否足够稳定，能不能支持自动化。如果抽取结果噪声较大，就在请求里补充文档差异、扫描质量，以及是否需要保留表格。这通常比把提示词改得更宽泛更有效。

优化输出质量，不只是代码

如果第一次结果已经接近但还不够理想，就用具体失败点来继续调整：比如缺少明细行、字段合并、日期解析错误，或者页面 OCR 出错。对于 azure-ai-document-intelligence-dotnet for OCR Extraction 来说，这种迭代尤其重要，因为文档质量和模型选择的微小变化，往往比代码结构的改动更能影响结果。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取，也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取

收藏 0GitHub 2.3k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流，用于转换、合并、拆分、OCR、提取、脱敏、签署、优化，以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理

收藏 0GitHub 0

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取，并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致，适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取

收藏 0GitHub 2.2k

transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿，或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换

收藏 0GitHub 23

pdf

作者 K-Dense-AI

pdf skill 是一份实用的 PDF 处理指南，适合在工作流中需要读取、提取、转换或创建 PDF 文件时使用。它涵盖文本提取、合并、拆分、旋转、表单填充、加密、图像提取，以及扫描版 PDF 的 OCR。当你需要一份可重复使用的 pdf 指南，而不是一次性提示词时，它尤其合适。

PDF 处理

收藏 0GitHub 0

frontend-design

作者 anthropics

frontend-design 帮你把模糊的 UI 想法，转化为有审美导向的量产级界面，实现真实可用的前端代码，而不是千篇一律的 AI 风格。

UI 设计

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可将同事文档、聊天记录、邮件、截图、Feishu 和 DingTalk 数据整理为可编辑的 AI 技能，并分别产出工作风格与人物画像内容，还提供持续迭代的更新流程。

Skill 编写

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一项工作流技能，用于在 HyperFrames 中构建基于 HTML 的视频合成。适用于需要结构化、以代码为先的 hyperframes 视频编辑场景，比如标题卡、叠加层、字幕、配音、音频驱动动效和场景转场。它更强调布局、时序和动画决策，而不是泛泛的只靠提示词生成视频请求。

视频编辑

收藏 0GitHub 2.7k

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 帮助你在 Python 中使用 Microsoft Entra ID 配置 Azure 身份验证。它适合用于选择 DefaultAzureCredential、managed identity 或 service principal 认证，配置环境变量，并排查访问控制和凭据链问题。安装说明、使用模式和实用的配置提示均基于 repo skill file。

访问控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一项实用技能，帮助开发者安装并使用 Claude API 与 Anthropic SDK。它可协助选择合适的 SDK 或原生 HTTP 方案，识别对应语言文档，并更稳妥地实现流式输出、tool use、文件、批处理和错误处理，减少试错成本。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可帮助你找到 Cloudflare Workers 的正确 CLI 命令、配置结构和部署步骤。可用于 wrangler 的使用、wrangler 安装检查，以及在构建或交付 Workers 时获取一份实用的 wrangler 指南，适合 Backend Development 场景。

后端开发

收藏 0GitHub 1.3k