OCR 提取

浏览 数据处理 下与 OCR 提取 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

9 个技能
A
nutrient-document-processing

作者 affaan-m

nutrient-document-processing 技能,基于 Nutrient DWS API 进行 PDF 处理和文档自动化。可转换、OCR、提取、编辑脱敏、签名、加水印,并填写 PDF、DOCX、XLSX、PPTX、HTML 和图片等文件。

PDF 处理
收藏 0GitHub 156.2k
A
pdf

作者 anthropics

pdf skill 可处理多种 PDF Processing 任务,包括文本提取、合并与拆分、页面渲染为图片,以及 PDF 表单流程。它尤其适合检查可填写字段、提取表单元数据,并通过脚本验证不可填写表单的版式。

PDF 处理
收藏 0GitHub 105.1k
M
azure-ai-document-intelligence-ts

作者 microsoft

azure-ai-document-intelligence-ts 是一个 TypeScript 技能,用于借助 Azure Document Intelligence 提取文本、表格、键值字段和结构化数据。它适合发票、收据、身份证和表单的 OCR 提取,也适合在 Node.js 中结合 Azure REST SDK 认证来使用预置和自定义模型工作流。

OCR 提取
收藏 0GitHub 2.3k
M
azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容,适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出,就适合使用它。

RAG 工作流
收藏 0GitHub 2.2k
M
azure-ai-formrecognizer-java

作者 microsoft

azure-ai-formrecognizer-java 技能帮助 Java 开发者使用 Azure AI Document Intelligence 进行 OCR 提取,并处理表格、键值对、发票、收据、身份证件和自定义文档模型。它与当前的 `com.azure:azure-ai-documentintelligence` SDK 保持一致,适合需要实用的 Java 配置、API 指南和可重复文档分析的场景。

OCR 提取
收藏 0GitHub 2.2k
M
azure-ai-document-intelligence-dotnet

作者 microsoft

azure-ai-document-intelligence-dotnet 帮助 .NET 开发者安装并使用 Azure AI Document Intelligence,从发票、收据、身份证件和自定义文档中提取文本、表格、键值对和结构化字段。它包含实用的配置、身份验证以及 OCR 提取指导,便于进行可靠的文档分析。

OCR 提取
收藏 0GitHub 2.2k
R
transcribe-video

作者 rameerez

transcribe-video 技能可使用 AWS Transcribe 将视频或音频文件转换为 .srt、.vtt 和 .txt 输出。适合需要字幕、可检索转写稿,或将口语内容整理为干净文本版本的 transcribe-video 场景。它也适用于 transcribe-video 的 Format Conversion 工作流。

格式转换
收藏 0GitHub 23
K
kreuzberg

作者 kreuzberg-dev

kreuzberg 技能可帮助你安装并使用 Kreuzberg 进行文档抽取,支持 91+ 种格式,包括 PDF、Office 文件、图片、HTML、邮件和压缩包。它覆盖 Python、Node.js/TypeScript、Rust 和 CLI 工作流,适用于 OCR、表格、元数据、批量处理以及实用的解析指导。

PDF 处理
收藏 0GitHub 0
P
nutrient-document-processing

作者 PSPDFKit-labs

nutrient-document-processing 是一个基于 Nutrient DWS 的 PDF 处理工作流技能。它帮助你安装、理解并使用可重复的文档工作流,用于转换、合并、拆分、OCR、提取、脱敏、签署、优化,以及生成 PDF/A 或 PDF/UA 等合规输出。

PDF 处理
收藏 0GitHub 0
OCR 提取 Agent Skill