OCR

Explore agent skills com a tag OCR e compare workflows relacionados no diretorio.

12 skills
A
visa-doc-translate

por affaan-m

O visa-doc-translate traduz imagens de documentos de solicitação de visto para o inglês e cria um PDF bilíngue com a página original e a tradução. Ele foi feito para documentação de visto estruturada, fallback de OCR, tratamento de rotação e preservação de nomes, datas e valores.

Translation
Favoritos 0GitHub 156.3k
A
nutrient-document-processing

por affaan-m

Skill nutrient-document-processing para processamento de PDFs e automação de documentos com a Nutrient DWS API. Converta, faça OCR, extraia, redija, assine, adicione watermark e preencha arquivos como PDFs, DOCX, XLSX, PPTX, HTML e imagens.

PDF Processing
Favoritos 0GitHub 156.2k
A
pdf

por anthropics

A skill pdf orienta tarefas de processamento de PDFs, como extração de texto, mesclagem e divisão de arquivos, renderização de páginas em imagens e fluxos com formulários PDF. É especialmente útil para verificar campos preenchíveis, extrair metadados de formulários e validar layouts de formulários não preenchíveis com scripts.

PDF Processing
Favoritos 0GitHub 105.1k
M
azure-ai-vision-imageanalysis-py

por microsoft

O skill azure-ai-vision-imageanalysis-py ajuda você a instalar e usar o Azure AI Vision Image Analysis SDK para Python. Ele cobre captions, tags, objects, OCR, detection of people e smart cropping, com orientações de setup, autenticação e ambiente voltadas para backend em fluxos de entendimento de imagens com Azure.

Backend Development
Favoritos 0GitHub 2.3k
M
azure-ai-document-intelligence-ts

por microsoft

azure-ai-document-intelligence-ts é uma skill em TypeScript para extrair texto, tabelas, campos chave-valor e dados estruturados com o Azure Document Intelligence. Use-a para OCR de faturas, recibos, documentos de identidade e formulários, ou quando precisar de fluxos com modelos prebuilt e personalizados no Node.js com autenticação via Azure REST SDK.

OCR Extraction
Favoritos 0GitHub 2.3k
M
azure-ai-contentunderstanding-py

por microsoft

azure-ai-contentunderstanding-py é a skill em Python para o Azure AI Content Understanding. Ela extrai conteúdo estruturado de documentos, imagens, áudio e vídeo para fluxos de trabalho de RAG e automação. Use-a quando precisar de extração multimodal confiável, autenticação com Azure e saídas repetíveis prontas para pipeline.

RAG Workflows
Favoritos 0GitHub 2.2k
M
azure-ai-vision-imageanalysis-java

por microsoft

azure-ai-vision-imageanalysis-java ajuda você a criar apps Java de análise de imagens com o Azure AI Vision. Use para gerar legendas, fazer OCR, detectar objetos, marcar imagens, detectar pessoas, fazer smart cropping e desenvolver APIs, com configuração do SDK, autenticação e exemplos.

API Development
Favoritos 0GitHub 2.2k
M
azure-ai-formrecognizer-java

por microsoft

A skill azure-ai-formrecognizer-java ajuda desenvolvedores Java a usar o Azure AI Document Intelligence para extração OCR, tabelas, pares chave-valor, notas fiscais, recibos, documentos de identidade e modelos personalizados de documentos. Ela está alinhada ao SDK atual `com.azure:azure-ai-documentintelligence` e é útil quando você precisa de configuração prática em Java, orientação de API e análise de documentos repetível.

OCR Extraction
Favoritos 0GitHub 2.2k
M
azure-ai-document-intelligence-dotnet

por microsoft

O azure-ai-document-intelligence-dotnet ajuda desenvolvedores .NET a instalar e usar o Azure AI Document Intelligence para extrair texto, tabelas, pares chave-valor e campos estruturados de faturas, recibos, documentos de identidade e documentos personalizados. Inclui orientações práticas de configuração, autenticação e OCR Extraction para uma análise documental mais confiável.

OCR Extraction
Favoritos 0GitHub 2.2k
K
pdf

por K-Dense-AI

A skill pdf é um guia prático para Processamento de PDF quando você precisa ler, extrair, transformar ou criar arquivos PDF em um fluxo de trabalho pronto para produção. Cobre extração de texto, mesclagem, divisão, rotação, preenchimento de formulários, criptografia, extração de imagens e OCR para PDFs digitalizados. Use quando precisar de um guia pdf repetível, em vez de um prompt pontual.

PDF Processing
Favoritos 0GitHub 0
K
markitdown

por K-Dense-AI

markitdown converte arquivos e documentos de escritório para Markdown, facilitando a leitura, a segmentação em partes, a busca e fluxos de trabalho com LLMs. Esta skill markitdown oferece suporte a PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, imagens com OCR e transcrição de áudio, tornando-se um guia prático do markitdown para conversão de formatos.

Format Conversion
Favoritos 0GitHub 0
P
nutrient-document-processing

por PSPDFKit-labs

nutrient-document-processing é uma skill de fluxo de trabalho para Processamento de PDF com Nutrient DWS. Ela ajuda você a instalar, entender e usar fluxos documentais repetíveis para converter, mesclar, dividir, aplicar OCR, extrair, redigir, assinar, otimizar e gerar saídas de conformidade como PDF/A ou PDF/UA.

PDF Processing
Favoritos 0GitHub 0
OCR tagged agent skills