OCR

Explora agent skills con la etiqueta OCR y compara workflows relacionados en el directorio.

10 skills
A
visa-doc-translate

por affaan-m

visa-doc-translate traduce imágenes de documentos para solicitudes de visa al inglés y crea un PDF bilingüe con la página original y la traducción. Está pensado para trámites de visa estructurados, con respaldo OCR, manejo de rotación y preservación de nombres, fechas y cantidades.

Translation
Favoritos 0GitHub 156.3k
A
nutrient-document-processing

por affaan-m

Skill de nutrient-document-processing para procesar PDF y automatizar documentos con la API de Nutrient DWS. Convierte, aplica OCR, extrae, redacta, firma, añade marcas de agua y completa archivos como PDFs, DOCX, XLSX, PPTX, HTML e imágenes.

PDF Processing
Favoritos 0GitHub 156.2k
A
pdf

por anthropics

La skill pdf guía tareas de procesamiento de PDF como extracción de texto, combinación y división de archivos, renderizado de páginas a imágenes y flujos de trabajo con formularios PDF. Resulta especialmente útil para comprobar campos rellenables, extraer metadatos de formularios y validar con scripts diseños de formularios no rellenables.

PDF Processing
Favoritos 0GitHub 105.1k
M
azure-ai-vision-imageanalysis-py

por microsoft

El skill azure-ai-vision-imageanalysis-py te ayuda a instalar y usar el SDK de Azure AI Vision Image Analysis para Python. Cubre captions, tags, objetos, OCR, detección de personas y recorte inteligente, con configuración orientada a backend, autenticación y guía de entorno para flujos de trabajo de comprensión de imágenes en Azure.

Backend Development
Favoritos 0GitHub 2.3k
M
azure-ai-document-intelligence-ts

por microsoft

azure-ai-document-intelligence-ts es una skill en TypeScript para extraer texto, tablas, campos clave-valor y datos estructurados con Azure Document Intelligence. Úsala para OCR Extraction en facturas, recibos, documentos de identidad y formularios, o cuando necesites flujos de trabajo con modelos preconstruidos y personalizados en Node.js con autenticación de Azure REST SDK.

OCR Extraction
Favoritos 0GitHub 2.3k
M
azure-ai-contentunderstanding-py

por microsoft

azure-ai-contentunderstanding-py es la skill de Python para Azure AI Content Understanding. Extrae contenido estructurado de documentos, imágenes, audio y video para flujos de trabajo RAG y automatización. Úsala cuando necesites extracción multimodal fiable, autenticación con Azure y resultados repetibles, listos para integrar en pipelines.

RAG Workflows
Favoritos 0GitHub 2.2k
M
azure-ai-vision-imageanalysis-java

por microsoft

azure-ai-vision-imageanalysis-java te ayuda a crear aplicaciones Java de análisis de imágenes con Azure AI Vision. Úsalo para generar descripciones, hacer OCR, detectar objetos, etiquetar imágenes, detectar personas, recorte inteligente y desarrollo con API, con configuración del SDK, autenticación y ejemplos.

API Development
Favoritos 0GitHub 2.2k
M
azure-ai-formrecognizer-java

por microsoft

La skill azure-ai-formrecognizer-java ayuda a los desarrolladores Java a usar Azure AI Document Intelligence para extracción OCR, tablas, pares clave-valor, facturas, recibos, documentos de identidad y modelos de documento personalizados. Está alineada con el SDK actual `com.azure:azure-ai-documentintelligence` y resulta útil cuando necesitas una configuración práctica en Java, guía de API y análisis de documentos repetible.

OCR Extraction
Favoritos 0GitHub 2.2k
M
azure-ai-document-intelligence-dotnet

por microsoft

azure-ai-document-intelligence-dotnet ayuda a desarrolladores de .NET a instalar y usar Azure AI Document Intelligence para extraer texto, tablas, pares clave-valor y campos estructurados de facturas, recibos, documentos de identidad y documentos personalizados. Incluye guía práctica de configuración, autenticación y extracción OCR para un análisis de documentos fiable.

OCR Extraction
Favoritos 0GitHub 2.2k
P
nutrient-document-processing

por PSPDFKit-labs

nutrient-document-processing es una skill de flujo de trabajo para el procesamiento de PDF con Nutrient DWS. Te ayuda a instalar, entender y usar flujos documentales repetibles para convertir, combinar, dividir, aplicar OCR, extraer, redactar, firmar, optimizar y generar salidas de cumplimiento como PDF/A o PDF/UA.

PDF Processing
Favoritos 0GitHub 0