azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取，也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

Stars2.3k

收录时间2026年5月8日

分类OCR 提取

安装命令

npx skills add microsoft/skills --skill azure-ai-document-intelligence-ts

编辑评分

该技能评分为 84/100，说明它是一个相当扎实的目录条目，适合想要 TypeScript 版 Azure Document Intelligence 工作流的用户。仓库提供了足够的实际操作指引，能让 agent 比照通用提示更少猜测地触发并使用它，但如果再补充一些上手辅助内容会更好。

84/100

亮点

用途定位清晰：描述中明确写出了文档文本、表格、结构化数据、发票、收据、身份证、表单以及自定义模型等场景。
操作说明比较明确：SKILL.md 包含安装、环境变量和认证指引，并特别说明客户端是 function 而不是 class，这一点很关键。
工作流内容较充实：技能正文篇幅较长，包含多个标题和代码块，说明它不只是占位或演示骨架。

注意点

SKILL.md 中没有安装命令，也没有配套支持文件（scripts、references、resources），因此用户需要主要依赖文档本身完成设置和执行。
预览中只展示了截断的代码示例，而且没有仓库/文件引用，因此部分实现细节可能仍需查阅外部 Azure 文档。

TypeScript Azure Node.js SDK API OCR PDF Documents

概览

azure-ai-document-intelligence-ts 技能概览

azure-ai-document-intelligence-ts 是一个 TypeScript 技能，适用于使用 Azure Document Intelligence 提取文本、表格、键值字段和结构化文档数据。它最适合需要从发票、收据、身份证件和表单等真实业务文档中做 OCR Extraction 的团队，或者希望通过 Node.js 调用 Azure REST SDK 中的预置模型和自定义模型的团队。

这个技能适合做什么

当你的目标不是“总结一个文件”，而是“把文档转成可用数据”时，就该使用 azure-ai-document-intelligence-ts 技能。它适合需要稳定字段提取、按页文本、表格捕获，或者需要自定义模型工作流起点的场景。

为什么很多人会安装它

它的核心价值在于：提供一条从配置到经过身份验证的 TypeScript API 调用的清晰路径。对于想走 Azure SDK 方案、而不是通用提示词方案，并且非常在意 endpoint、credential 和环境变量是否配置正确的用户来说，azure-ai-document-intelligence-ts 安装尤其有用。

什么情况下它最合适

如果你的应用本来就在使用 Azure，如果你需要适合生产环境的身份验证，或者你正在构建依赖可靠 OCR Extraction 的文档摄取功能，这个技能会很合适。反过来，如果你只是想对单个文件做一次性的转写，而完全不需要 Azure 依赖，它的价值就没那么大。

如何使用 azure-ai-document-intelligence-ts 技能

安装并确认 SDK 路径

运行 azure-ai-document-intelligence-ts 安装步骤：

npm install @azure-rest/ai-document-intelligence @azure/identity

然后在写代码之前，先确认你已经有 Azure Document Intelligence 资源、endpoint，以及合适的 credential 方案。这个技能默认你是在 TypeScript 项目里工作，并且想要使用 Azure REST client 的调用形态。

先从正确的仓库文件看起

在使用 azure-ai-document-intelligence-ts 时，先读 SKILL.md，再查看任何会影响身份验证、示例或运行时假设的仓库级说明。如果仓库里有安装、环境变量和身份验证相关章节，应优先看这些内容，再把代码改造到你的应用里。

把模糊目标变成可执行提示

这个技能的好提示词应该明确文档类型、输出结构和身份验证上下文。例如：“使用 azure-ai-document-intelligence-ts 在 TypeScript 中提取发票总额、供应商名称、日期和明细行。我有 Azure endpoint，开发环境想用 DefaultAzureCredential，并且需要 JSON 输出供下游校验。” 这比“分析这个 PDF”好得多，因为它明确告诉技能哪些字段重要，以及输出要多严格。

提升效果的实用工作流

先确认环境变量，再测试单个文档，最后再扩展到批量或自定义模型。如果你用 azure-ai-document-intelligence-ts 做 OCR Extraction，要尽早决定你需要的是原始文本、结构化字段还是表格，因为这个选择会改变 API 调用方式，也会影响你后续要做的后处理。

azure-ai-document-intelligence-ts 技能常见问题

azure-ai-document-intelligence-ts 适合初学者吗？

如果你熟悉 npm、TypeScript 和 Azure 凭据，它是适合初学者的。但它不是零代码技能；azure-ai-document-intelligence-ts 指南默认你能提供 endpoint、认证方式，以及一个现实可行的文档工作流。

它和普通提示词有什么区别？

普通提示词可能只能帮你描述文档，而 azure-ai-document-intelligence-ts 会把这个意图落到真实的 SDK 和安装路径上。当你需要可重复的 Azure API 使用方式，而不是对粘贴文本做一次性推理时，这个技能就很有用。

什么时候不该用它？

如果你不想管理 Azure 资源、不能提供安全的身份验证方案，或者你的任务只是简单的文本清理而不需要提取逻辑，就不该用 azure-ai-document-intelligence-ts。若你只需要从截图里快速做 OCR，更轻量的流程可能更快。

它支持面向生产应用的 OCR Extraction 吗？

支持，这也是它的主要用途之一。当 OCR Extraction 需要集成到真实的 Node.js 应用中，并且依赖环境变量配置和 Azure Identity 支持时，这个技能会更合适。

如何改进 azure-ai-document-intelligence-ts 技能

提供面向文档的提取目标

最有效的改进，是把你要的字段名说清楚。例如，不要只说“从发票里提取数据”，而要说“提取发票号码、税额、小计、总计、供应商地址以及每一条明细”。当输出 schema 明确时，azure-ai-document-intelligence-ts 技能的表现通常会更好。

补充身份验证、endpoint 和运行约束

说明你想用 DefaultAzureCredential、API key 认证、本地开发、managed identity 还是 service principal。azure-ai-document-intelligence-ts 的使用流程在知道自己要优化本地开发、CI 还是生产部署时，会清晰得多。

注意常见失败模式

最常见的问题是：文档范围太模糊、缺少环境变量、以及指望一个模型适用于所有文件类型。如果结果不理想，可以通过补充示例文件名、预期的 JSON 键，以及文档是扫描件、数字文档还是混合内容 OCR Extraction 来改进提示词。

基于一个已知可用样本反复迭代

先拿一份有代表性的文档，和你期望的 schema 对照输出结果。然后再细化提示词或下游解析规则。对于 azure-ai-document-intelligence-ts 来说，提升输出质量最快的方法通常是：提供更好的文档示例、更严格的字段定义，以及更清晰地区分文本提取和结构化模型提取。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取，支持 91+ 种格式，包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流，适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理

收藏 0GitHub 0

pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务，包括文本提取、合并与拆分、页面渲染为图片，以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据，并通过脚本验证不可填写表单的版式。

PDF 处理

收藏 0GitHub 105.1k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence，从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导，便于进行可靠的文档分析。

OCR 提取

收藏 0GitHub 2.2k

nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流，用于转换、合并、拆分、OCR、提取、脱敏、签署、优化，以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理

收藏 0GitHub 0

nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能，基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印，并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理

收藏 0GitHub 156.2k

azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取，并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致，适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取

收藏 0GitHub 2.2k

transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿，或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换

收藏 0GitHub 23

frontend-design

作者 anthropics

frontend-design 帮你把模糊的 UI 想法，转化为有审美导向的量产级界面，实现真实可用的前端代码，而不是千篇一律的 AI 风格。

UI 设计

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可将同事文档、聊天记录、邮件、截图、Feishu 和 DingTalk 数据整理为可编辑的 AI 技能，并分别产出工作风格与人物画像内容，还提供持续迭代的更新流程。

Skill 编写

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一项工作流技能，用于在 HyperFrames 中构建基于 HTML 的视频合成。适用于需要结构化、以代码为先的 hyperframes 视频编辑场景，比如标题卡、叠加层、字幕、配音、音频驱动动效和场景转场。它更强调布局、时序和动画决策，而不是泛泛的只靠提示词生成视频请求。

视频编辑

收藏 0GitHub 2.7k

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 帮助你在 Python 中使用 Microsoft Entra ID 配置 Azure 身份验证。它适合用于选择 DefaultAzureCredential、managed identity 或 service principal 认证，配置环境变量，并排查访问控制和凭据链问题。安装说明、使用模式和实用的配置提示均基于 repo skill file。

访问控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一项实用技能，帮助开发者安装并使用 Claude API 与 Anthropic SDK。它可协助选择合适的 SDK 或原生 HTTP 方案，识别对应语言文档，并更稳妥地实现流式输出、tool use、文件、批处理和错误处理，减少试错成本。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可帮助你找到 Cloudflare Workers 的正确 CLI 命令、配置结构和部署步骤。可用于 wrangler 的使用、wrangler 安装检查，以及在构建或交付 Workers 时获取一份实用的 wrangler 指南，适合 Backend Development 场景。

后端开发

收藏 0GitHub 1.3k

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412