OCR

Entdecke Agent Skills mit dem Tag OCR und vergleiche verwandte Workflows im Verzeichnis.

12 Skills

visa-doc-translate

von affaan-m

visa-doc-translate übersetzt Bilder von Visumanträgen ins Englische und erstellt ein zweisprachiges PDF mit der Originalseite und der Übersetzung. Die Skill ist für strukturierte Visa-Unterlagen gebaut und unterstützt OCR-Fallback, Rotationskorrektur sowie die zuverlässige Übernahme von Namen, Daten und Beträgen.

Translation

Favoriten 0GitHub 156.3k

nutrient-document-processing

von affaan-m

nutrient-document-processing Skill für PDF-Verarbeitung und Dokumentenautomatisierung mit der Nutrient DWS API. Konvertieren, OCRen, extrahieren, schwärzen, signieren, mit Wasserzeichen versehen und Dateien wie PDFs, DOCX, XLSX, PPTX, HTML und Bilder ausfüllen.

PDF Processing

Favoriten 0GitHub 156.2k

pdf

von anthropics

Der pdf Skill unterstützt bei Aufgaben der PDF-Verarbeitung wie Textextraktion, Zusammenführen und Teilen, dem Rendern von Seiten als Bilder sowie Formular-Workflows. Besonders nützlich ist er zum Prüfen ausfüllbarer Felder, zum Extrahieren von Formularmetadaten und zur skriptgestützten Validierung nicht ausfüllbarer Formularlayouts.

PDF Processing

Favoriten 0GitHub 105.1k

azure-ai-vision-imageanalysis-py

von microsoft

Die Skill azure-ai-vision-imageanalysis-py hilft dir dabei, das Azure AI Vision Image Analysis SDK für Python zu installieren und zu nutzen. Sie behandelt Bildunterschriften, Tags, Objekte, OCR, Personenerkennung und intelligentes Zuschneiden – mit backend-orientierten Hinweisen zu Setup, Authentifizierung und Umgebung für Azure-basierte Workflows zur Bilderkennung.

Backend Development

Favoriten 0GitHub 2.3k

azure-ai-document-intelligence-ts

von microsoft

azure-ai-document-intelligence-ts ist ein TypeScript-Skill zum Extrahieren von Text, Tabellen, Key-Value-Feldern und strukturierten Daten mit Azure Document Intelligence. Nutzen Sie ihn für OCR-Extraktion aus Rechnungen, Belegen, Ausweisen und Formularen oder wenn Sie in Node.js Workflows mit vortrainierten und benutzerdefinierten Modellen und Azure REST SDK-Authentifizierung benötigen.

OCR Extraction

Favoriten 0GitHub 2.3k

azure-ai-contentunderstanding-py

von microsoft

azure-ai-contentunderstanding-py ist das Python-Skill für Azure AI Content Understanding. Es extrahiert strukturierte Inhalte aus Dokumenten, Bildern, Audio und Video für RAG-Workflows und Automatisierung. Nutzen Sie es, wenn Sie zuverlässige multimodale Extraktion, Azure-Authentifizierung und reproduzierbare, pipelinefähige Ausgaben benötigen.

RAG Workflows

Favoriten 0GitHub 2.2k

azure-ai-vision-imageanalysis-java

von microsoft

azure-ai-vision-imageanalysis-java hilft dir beim Erstellen von Java-Apps für die Bildanalyse mit Azure AI Vision. Nutze es für Bildbeschreibungen, OCR, Objekterkennung, Tagging, Personenerkennung, Smart Cropping und API-Entwicklung mit SDK-Setup, Authentifizierung und Beispielen.

API Development

Favoriten 0GitHub 2.2k

azure-ai-formrecognizer-java

von microsoft

Die azure-ai-formrecognizer-java Skill hilft Java-Entwicklern dabei, Azure AI Document Intelligence für OCR-Extraktion, Tabellen, Schlüssel-Wert-Paare, Rechnungen, Belege, Ausweise und benutzerdefinierte Dokumentmodelle zu nutzen. Sie ist auf das aktuelle SDK com.azure:azure-ai-documentintelligence ausgerichtet und besonders hilfreich, wenn Sie eine praxistaugliche Java-Einrichtung, API-Hinweise und wiederholbare Dokumentanalyse benötigen.

OCR Extraction

Favoriten 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

von microsoft

azure-ai-document-intelligence-dotnet hilft .NET-Entwicklern, Azure AI Document Intelligence zu installieren und zu nutzen, um Text, Tabellen, Key-Value-Paare und strukturierte Felder aus Rechnungen, Belegen, Ausweisen und benutzerdefinierten Dokumenten zu extrahieren. Enthalten sind praxisnahe Hinweise zu Einrichtung, Authentifizierung und OCR-Extraktion für eine zuverlässige Dokumentenanalyse.

OCR Extraction

Favoriten 0GitHub 2.2k

pdf

von K-Dense-AI

Das pdf-Skill ist ein praxisnaher Leitfaden für PDF-Processing, wenn Sie PDF-Dateien in einem belastbaren Workflow lesen, extrahieren, umwandeln oder erstellen müssen. Es behandelt Text-Extraktion, Zusammenführen, Teilen, Rotieren, Ausfüllen von Formularen, Verschlüsselung, Bild-Extraktion und OCR für gescannte PDFs. Nutzen Sie es, wenn Sie statt eines einmaligen Prompts einen wiederverwendbaren pdf-Leitfaden brauchen.

PDF Processing

Favoriten 0GitHub 0

markitdown

von K-Dense-AI

markitdown konvertiert Dateien und Office-Dokumente in Markdown, damit Inhalte leichter lesbar, in Chunks aufteilbar und durchsuchbar sind und sich besser in LLM-Workflows nutzen lassen. Diese markitdown-Skill unterstützt PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, Bilder mit OCR und Audio-Transkription und ist damit ein praktischer markitdown-Leitfaden für die Formatkonvertierung.

Format Conversion

Favoriten 0GitHub 0

nutrient-document-processing

von PSPDFKit-labs

nutrient-document-processing ist ein Workflow-Skill für PDF-Verarbeitung mit Nutrient DWS. Er hilft dabei, wiederholbare Dokument-Workflows zum Konvertieren, Zusammenführen, Teilen, OCRen, Extrahieren, Schwärzen, Signieren, Optimieren und für Compliance-Ausgaben wie PDF/A oder PDF/UA zu installieren, zu verstehen und anzuwenden.

PDF Processing

Favoriten 0GitHub 0