OCR

浏览带有 OCR 标签的 Agent Skill,并比较目录中的相关工作流与详情页。

10 个技能
A
visa-doc-translate

作者 affaan-m

visa-doc-translate 可将签证申请文件图片翻译成英文,并生成包含原页与译文的双语 PDF。它面向结构化签证材料,支持 OCR 兜底、旋转处理,并尽量保留姓名、日期和金额等关键信息。

翻译
收藏 0GitHub 156.3k
A
nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能,基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印,并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理
收藏 0GitHub 156.2k
A
pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务,包括文本提取、合并与拆分、页面渲染为图片,以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据,并通过脚本验证不可填写表单的版式。

PDF 处理
收藏 0GitHub 105.1k
M
azure-ai-vision-imageanalysis-py

作者 microsoft

azure-ai-vision-imageanalysis-py 技能可帮助你安装并使用 Azure AI Vision Image Analysis 的 Python SDK。它涵盖图像描述、标签、对象、OCR、人物检测和智能裁剪,并提供面向后端的配置、身份验证和环境指导,适用于基于 Azure 的图像理解工作流。

后端开发
收藏 0GitHub 2.3k
M
azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能,用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取,也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取
收藏 0GitHub 2.3k
M
azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容,适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出,就适合使用它。

RAG 工作流
收藏 0GitHub 2.2k
M
azure-ai-vision-imageanalysis-java

作者 microsoft

azure-ai-vision-imageanalysis-java 可帮助你用 Azure AI Vision 构建 Java 图像分析应用。适用于图像描述、OCR、目标检测、标签识别、人物检测、智能裁剪以及 API 开发,并提供 SDK 配置、身份验证和示例。

API 开发
收藏 0GitHub 2.2k
M
azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取,并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致,适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取
收藏 0GitHub 2.2k
M
azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence,从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导,便于进行可靠的文档分析。

OCR 提取
收藏 0GitHub 2.2k
P
nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流,用于转换、合并、拆分、OCR、提取、脱敏、签署、优化,以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理
收藏 0GitHub 0
OCR 标签 Agent Skill