OCR

Explora agent skills con la etiqueta OCR y compara workflows relacionados en el directorio.

12 skills

visa-doc-translate

por affaan-m

visa-doc-translate traduce imágenes de documentos para solicitudes de visa al inglés y crea un PDF bilingüe con la página original y la traducción. Está pensado para trámites de visa estructurados, con respaldo OCR, manejo de rotación y preservación de nombres, fechas y cantidades.

Translation

Favoritos 0GitHub 156.3k

nutrient-document-processing

por affaan-m

Skill de nutrient-document-processing para procesar PDF y automatizar documentos con la API de Nutrient DWS. Convierte, aplica OCR, extrae, redacta, firma, añade marcas de agua y completa archivos como PDFs, DOCX, XLSX, PPTX, HTML e imágenes.

PDF Processing

Favoritos 0GitHub 156.2k

pdf

por anthropics

La skill pdf guía tareas de procesamiento de PDF como extracción de texto, combinación y división de archivos, renderizado de páginas a imágenes y flujos de trabajo con formularios PDF. Resulta especialmente útil para comprobar campos rellenables, extraer metadatos de formularios y validar con scripts diseños de formularios no rellenables.

PDF Processing

Favoritos 0GitHub 105.1k

azure-ai-vision-imageanalysis-py

por microsoft

El skill azure-ai-vision-imageanalysis-py te ayuda a instalar y usar el SDK de Azure AI Vision Image Analysis para Python. Cubre captions, tags, objetos, OCR, detección de personas y recorte inteligente, con configuración orientada a backend, autenticación y guía de entorno para flujos de trabajo de comprensión de imágenes en Azure.

Backend Development

Favoritos 0GitHub 2.3k

azure-ai-document-intelligence-ts

por microsoft

azure-ai-document-intelligence-ts es una skill en TypeScript para extraer texto, tablas, campos clave-valor y datos estructurados con Azure Document Intelligence. Úsala para OCR Extraction en facturas, recibos, documentos de identidad y formularios, o cuando necesites flujos de trabajo con modelos preconstruidos y personalizados en Node.js con autenticación de Azure REST SDK.

OCR Extraction

Favoritos 0GitHub 2.3k

azure-ai-contentunderstanding-py

por microsoft

azure-ai-contentunderstanding-py es la skill de Python para Azure AI Content Understanding. Extrae contenido estructurado de documentos, imágenes, audio y video para flujos de trabajo RAG y automatización. Úsala cuando necesites extracción multimodal fiable, autenticación con Azure y resultados repetibles, listos para integrar en pipelines.

RAG Workflows

Favoritos 0GitHub 2.2k

azure-ai-vision-imageanalysis-java

por microsoft

azure-ai-vision-imageanalysis-java te ayuda a crear aplicaciones Java de análisis de imágenes con Azure AI Vision. Úsalo para generar descripciones, hacer OCR, detectar objetos, etiquetar imágenes, detectar personas, recorte inteligente y desarrollo con API, con configuración del SDK, autenticación y ejemplos.

API Development

Favoritos 0GitHub 2.2k

azure-ai-formrecognizer-java

por microsoft

La skill azure-ai-formrecognizer-java ayuda a los desarrolladores Java a usar Azure AI Document Intelligence para extracción OCR, tablas, pares clave-valor, facturas, recibos, documentos de identidad y modelos de documento personalizados. Está alineada con el SDK actual `com.azure:azure-ai-documentintelligence` y resulta útil cuando necesitas una configuración práctica en Java, guía de API y análisis de documentos repetible.

OCR Extraction

Favoritos 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

por microsoft

azure-ai-document-intelligence-dotnet ayuda a desarrolladores de .NET a instalar y usar Azure AI Document Intelligence para extraer texto, tablas, pares clave-valor y campos estructurados de facturas, recibos, documentos de identidad y documentos personalizados. Incluye guía práctica de configuración, autenticación y extracción OCR para un análisis de documentos fiable.

OCR Extraction

Favoritos 0GitHub 2.2k

pdf

por K-Dense-AI

La skill pdf es una guía práctica de procesamiento de PDF cuando necesitas leer, extraer, transformar o crear archivos PDF en un flujo de trabajo que puedas poner en producción. Cubre extracción de texto, combinación, división, rotación, relleno de formularios, cifrado, extracción de imágenes y OCR para PDFs escaneados. Úsala cuando necesites una guía pdf repetible en lugar de un prompt aislado.

PDF Processing

Favoritos 0GitHub 0

markitdown

por K-Dense-AI

markitdown convierte archivos y documentos de oficina a Markdown para facilitar la lectura, la fragmentación, la búsqueda y los flujos de trabajo con LLM. Esta skill de markitdown admite PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, imágenes con OCR y transcripción de audio, por lo que es una guía práctica de markitdown para la conversión de formatos.

Format Conversion

Favoritos 0GitHub 0

nutrient-document-processing

por PSPDFKit-labs

nutrient-document-processing es una skill de flujo de trabajo para el procesamiento de PDF con Nutrient DWS. Te ayuda a instalar, entender y usar flujos documentales repetibles para convertir, combinar, dividir, aplicar OCR, extraer, redactar, firmar, optimizar y generar salidas de cumplimiento como PDF/A o PDF/UA.

PDF Processing

Favoritos 0GitHub 0