pdf

von anthropics

Der pdf Skill unterstützt bei Aufgaben der PDF-Verarbeitung wie Textextraktion, Zusammenführen und Teilen, dem Rendern von Seiten als Bilder sowie Formular-Workflows. Besonders nützlich ist er zum Prüfen ausfüllbarer Felder, zum Extrahieren von Formularmetadaten und zur skriptgestützten Validierung nicht ausfüllbarer Formularlayouts.

Stars105.1k

Favoriten0

Kommentare0

Hinzugefügt28. März 2026

KategoriePDF Processing

Installationsbefehl

npx skills add anthropics/skills --skill pdf

Kurationswert

Dieser Skill erreicht 84/100 und ist damit ein starker Kandidat für Verzeichnisseinträge bei Agents, die mit PDFs arbeiten müssen. Nutzer des Verzeichnisses erhalten eine breite Abdeckung typischer Auslöser, umfangreiche prozedurale Inhalte und konkrete Hilfsskripte – besonders für das Ausfüllen von Formularen. Dadurch kann ein Agent meist mit weniger Rätselraten handeln als bei einem generischen Prompt, auch wenn Anforderungen an Umgebung und Setup im Skill selbst nicht vollständig erläutert sind.

84/100

Stärken

Sehr hohe Auffindbarkeit über Trigger: Die Beschreibung sagt ausdrücklich, dass der Skill verwendet werden soll, sobald der Nutzer eine .pdf erwähnt oder darum bittet, eine zu erzeugen, und nennt viele gängige PDF-Aufgaben.
Praktisch nutzbare Workflow-Inhalte: SKILL.md liefert Beispiele für zentrale PDF-Operationen, während forms.md schrittweise Anleitungen und Befehlsfolgen für ausfüllbare und nicht ausfüllbare Formulare enthält.
Hoher praktischer Nutzen durch enthaltene Skripte: Das Repo enthält mehrere Werkzeuge zum Prüfen von Formularfeldern, Extrahieren von Struktur, Konvertieren von PDFs in Bilder, Validieren von Bounding Boxes und Ausfüllen von Formularen.

Hinweise

Installations- und Laufzeitanforderungen werden eher vorausgesetzt als klar gebündelt beschrieben: SKILL.md enthält keinen Installationsbefehl, obwohl der Skill auf Python-Bibliotheken und Command-Line-Tools angewiesen ist.
Der Umfang ist sehr breit, aber einige fortgeschrittene Funktionen sind in Referenzmaterial ausgelagert. Nutzer müssen daher unter Umständen weiterhin zwischen Bibliotheken und Vorgehensweisen wählen.

Pdf OCR Python Cli Workflow

Überblick

Überblick über den pdf skill

Was der pdf skill leistet

Der pdf skill ist ein praxisnaher Leitfaden für PDF Processing, mit dem größten Mehrwert bei Routineaufgaben und Formular-Workflows. Er hilft einem Agenten, passende Tools und Arbeitsschritte für das Lesen von PDFs, das Extrahieren von Text, das Zusammenführen oder Aufteilen von Dateien, das Rendern von Seiten zu Bildern und insbesondere das korrekte Ausfüllen von PDF-Formularen auszuwählen.

Für wen sich dieser pdf skill lohnt

Dieser pdf skill eignet sich am besten für Nutzer, die regelmäßig mit PDFs in Automatisierungen, Datenerfassung, Dokument-Pipelines oder Agent-Workflows arbeiten. Er passt besonders gut, wenn Sie mehr als eine pauschale Antwort wie „verwende eine PDF-Bibliothek“ brauchen und konkrete Wege für ausfüllbare vs. nicht ausfüllbare Formulare, Seiten-Rendering und Validierung benötigen.

Typische Jobs-to-be-done

Die meisten Nutzer brauchen keinen umfassenden Theorieleitfaden zu PDFs. Sie brauchen einen verlässlichen Weg, Fragen wie diese zu beantworten:

„Wie extrahiere ich Text aus diesem PDF?“
„Wie führe ich Seiten sicher zusammen oder teile sie auf?“
„Hat dieses Formular tatsächlich ausfüllbare Felder?“
„Falls nicht: Wie finde ich heraus, wo Werte platziert werden müssen?“
„Wie prüfe ich, dass sich meine Feldboxen nicht überlappen?“

Dieser Skill ist nützlich, weil er aus solchen Fragen einen Workflow macht, statt den Agenten raten zu lassen.

Was pdf von einem generischen Prompt unterscheidet

Der wichtigste Unterschied ist die konsequente Formularbehandlung. Das Repository enthält eigene Anleitungen in forms.md sowie Hilfsskripte wie:

scripts/check_fillable_fields.py
scripts/extract_form_field_info.py
scripts/extract_form_structure.py
scripts/fill_fillable_fields.py
scripts/fill_pdf_form_with_annotations.py
scripts/check_bounding_boxes.py
scripts/create_validation_image.py

Das bedeutet: Der pdf guide dreht sich nicht nur um Bibliotheken, sondern liefert einen klaren Entscheidungsweg für Formulare und Validierung — genau dort scheitern viele PDF-Automatisierungen.

Wann pdf gut passt — und wann nicht

Setzen Sie pdf for PDF Processing ein, wenn Sie umsetzbare Anleitungen für Python-basierte Workflows, Bildkonvertierung, Rendering oder das Ausfüllen von Formularen brauchen.

Weniger überzeugend ist der Skill, wenn Sie nur eine Ein-Zeilen-Erinnerung für einen Standardbibliotheksaufruf suchen oder Ihr gesamter Stack außerhalb von Python liegt und Sie keine Beispiele aus reference.md übertragen möchten.

So verwenden Sie den pdf skill

Installationskontext für pdf

Installieren Sie den Skill aus dem Anthropic skills repository:

npx skills add https://github.com/anthropics/skills --skill pdf

Arbeiten Sie nach der Installation aus dem Skill-Verzeichnis heraus, statt nur die oberste Datei zu überfliegen, denn die wertvollsten Hinweise sind auf SKILL.md, forms.md, reference.md und den Ordner scripts/ verteilt.

Diese Dateien zuerst lesen

Für einen schnellen Einstieg öffnen Sie die Dateien in dieser Reihenfolge:

SKILL.md
forms.md
reference.md
scripts/check_fillable_fields.py
scripts/extract_form_field_info.py
scripts/fill_fillable_fields.py

Warum diese Reihenfolge wichtig ist:

SKILL.md deckt die gängigen Operationen und die Bibliotheksauswahl ab.
forms.md enthält die strikte Verzweigungslogik für Formularaufgaben.
reference.md erweitert das Ganze um Rendering- und JavaScript-Optionen.
Die Skripte zeigen die tatsächlich erwarteten Ein- und Ausgaben.

Den richtigen Workflow wählen, bevor Sie Code schreiben

Ein gutes Muster für die pdf-Nutzung beginnt mit der Einordnung der Aufgabe:

Textextraktion
Seitenmanipulation
PDF-Seiten als Bilder rendern
Ein Formular ausfüllen
Ein PDF aus Daten erzeugen

Machen Sie das zuerst, denn Formularaufgaben folgen einem deutlich anderen Pfad als Merge-/Split-/Extract-Aufgaben. Das Repository ist hier eindeutig: Das Ausfüllen von Formularen sollte nicht mit ad hoc geschriebenem Code starten.

So gehen Sie mit gewöhnlichen PDF-Operationen um

Für grundlegendes PDF Processing verweist der Skill zunächst auf pypdf. Das ist der Standardpfad für:

PDFs lesen
Seiten zählen
Text extrahieren
Dateien zusammenführen
Seiten aufteilen

Wenn Ihre Aufgabe lautet „diese Dateien zusammenführen“ oder „den Text seitenweise extrahieren“, sind die Beispiele in SKILL.md der schnellste Einstieg.

So gehen Sie mit Rendering und Bildkonvertierung um

Wenn Ihr Ziel Seitenscreenshots, Vorschaubilder, visuelle Prüfung oder bildbasierte Weiterverarbeitung ist, nutzen Sie die auf Rendering ausgerichteten Materialien:

reference.md für pypdfium2
scripts/convert_pdf_to_images.py für die PNG-Konvertierung

Das ist wichtig, wenn reine Textextraktion nicht ausreicht, etwa bei gescannten PDFs, visueller Formularprüfung oder der Kontrolle des Seitenlayouts vor dem Annotieren.

Die entscheidende Verzweigung bei PDF-Formularen

Für Formulare bietet der Skill einen strengeren Prozess als ein generischer Prompt. Starten Sie mit:

python scripts/check_fillable_fields.py <file.pdf>

Damit beantworten Sie die erste Entscheidung, an der viele Automatisierungen hängenbleiben:

Wenn das PDF ausfüllbare Felder hat, extrahieren Sie die Feldinformationen und befüllen diese Felder direkt.
Wenn nicht, verwenden Sie den Non-Fillable-Workflow aus forms.md, der auf visueller Struktur und Bounding Boxes basiert.

Diesen Check zu überspringen, ist der häufigste Weg, unnötig Zeit zu verlieren.

Eingaben, die bessere pdf-Ergebnisse liefern

Wenn Sie den pdf skill aufrufen, geben Sie idealerweise Folgendes mit:

den exakten Dateipfad oder die Dateinamen
ob das PDF digital oder gescannt ist
das gewünschte Ausgabeformat
ob Formulare ausfüllbar sind
ob Sie Texttreue, Layouttreue oder visuelle Ausgabe brauchen
ob Sie Python-Skripte lokal ausführen können

Eine schwache Anfrage:

„Hilf mir mit diesem PDF.“

Eine starke Anfrage:

„Ich muss ein 6-seitiges behördliches Formular-PDF ausfüllen. Prüfe zuerst, ob es ausfüllbare Felder hat. Wenn ja, extrahiere die Feldmetadaten nach JSON. Wenn nein, konvertiere die Seiten in Bilder, identifiziere die Eingabebereiche und erzeuge ein Validierungsbild, bevor Werte platziert werden.“

Die stärkere Variante ermöglicht es dem Agenten, sofort den richtigen Pfad zu wählen.

So prompten Sie den pdf skill sinnvoll

Ein verlässliches Prompt-Format ist:

Ziel
Datei(en)
Einschränkungen
gewünschte Ausgabe
Validierungsanforderung

Beispiel:

Ziel: Tabellen und Seitentext aus report.pdf extrahieren
Einschränkungen: nur Python, kein Cloud-OCR
Gewünschte Ausgabe: CSV-Tabellen plus ein Textdump pro Seite
Validierung: Seitenzahlen beibehalten und Seiten ohne Text melden

Das ist besser, als nur nach „PDF extraction“ zu fragen, weil der Skill mehrere Methoden abdeckt und die Qualität stark davon abhängt, die richtige auszuwählen.

Formular-Workflow für ausfüllbare PDFs

Wenn das PDF echte Felder hat, ist der sinnvolle nächste Schritt:

python scripts/extract_form_field_info.py <input.pdf> <field_info.json>

Das extrahierte JSON enthält Feld-IDs, Seitenzahlen, Rechtecke und Feldtypen wie:

text
checkbox
radio_group
choice

Das ist der praktische Kern des pdf guide für Formulare, weil er strukturierte Zielobjekte liefert, statt sich auf visuelles Raten zu verlassen.

Formular-Workflow für nicht ausfüllbare PDFs

Wenn das PDF nicht ausfüllbar ist, zeigt forms.md, dass Sie visuell bestimmen müssen, wo Werte eingetragen werden sollen. Die unterstützenden Skripte legen einen Workflow nahe wie:

das PDF in Bilder umwandeln
Formularstruktur und Bounding Boxes ableiten
die Platzierung der Boxen validieren
Annotationen oder eine ausgefüllte Ausgabe schreiben

Das ist langsamer als die Arbeit mit ausfüllbaren Feldern, aber das Repository bietet einen deutlich realistischeren Weg als „mach einfach OCR“.

Validierungsskripte nutzen, bevor Sie dem Output vertrauen

Zwei Skripte erhöhen die Zuverlässigkeit spürbar:

scripts/check_bounding_boxes.py
scripts/create_validation_image.py

Setzen Sie sie ein, wenn Sie mit nicht ausfüllbaren Formularen oder abgeleiteten Feldpositionen arbeiten. Sie helfen dabei, überlappende Eingabebereiche, Kollisionen mit Beschriftungen und Platzierungsfehler zu erkennen, bevor Sie die finale Ausgabe erzeugen.

Das ist ein echter Vorteil bei der Einführung dieses pdf install: Es enthält Validierungshelfer, nicht nur Transformationscode.

Bibliotheken und Tool-Auswahl innerhalb des Skills

Die praktische Tool-Aufteilung im Repository ist:

pypdf für Standardoperationen auf Dokumenten
pypdfium2 für Rendering und bildorientierte Aufgaben
pdf2image im Hilfsskript für die Konvertierung nach PNG
pdf-lib in reference.md, wenn Sie JavaScript für Erstellung oder Manipulation bevorzugen

Wenn Sie überlegen, ob Sie diesen pdf skill installieren sollen, ist diese Tool-Abdeckung relevant: Er ist nicht auf eine einzige Bibliothek festgelegt, hat aber dennoch einen klaren Standardpfad.

Häufige Fragen zum pdf skill

Ist dieser pdf skill nur zum Ausfüllen von Formularen da?

Nein. Der pdf skill deckt auch Extraktion, Merge-/Split-Operationen, Rendering, Erstellung und allgemeine PDF-Manipulation ab. Bei Formular-Workflows liefert er aber den größten zusätzlichen Entscheidungswert gegenüber einem gewöhnlichen Prompt.

Ist pdf für Einsteiger geeignet?

Ja, sofern Sie Python-Skripte ausführen können. Der beste Einstieg für Anfänger ist, mit SKILL.md für einfache Operationen zu beginnen und forms.md nur dann zu nutzen, wenn Ihre Aufgabe tatsächlich ein Formular betrifft. Die Skripte reduzieren das Rätselraten, setzen aber eine lokale Python-Umgebung und grundlegende Sicherheit im Umgang mit der Kommandozeile voraus.

Was macht dieser Skill besser als ein normaler LLM-Prompt?

Er liefert einen konkreten Workflow, um zwischen ausfüllbaren und nicht ausfüllbaren PDFs zu verzweigen, plus Validierungswerkzeuge. Ein normaler Prompt schlägt vielleicht Bibliotheken vor; dieser Skill zeigt, wann Felder geprüft werden sollten, wann Seiten gerendert werden müssen und wie Bounding Boxes verifiziert werden.

Wann sollte ich diesen pdf guide nicht verwenden?

Verlassen Sie sich nicht auf diesen pdf guide, wenn:

Sie eine vollständig verpackte Endnutzer-App statt eines Skills/Workflows benötigen
Sie keine lokalen Skripte ausführen können
Sie fortgeschrittene OCR-first-Pipelines brauchen, die über das explizit vom Repository Unterstützte hinausgehen
Sie statt eines gemischten Referenz-Toolkits ein einzelnes, klar vorgegebenes Produktions-Framework suchen

Unterstützt pdf auch JavaScript?

Teilweise. Der Hauptworkflow ist Python-first, aber reference.md enthält pdf-lib-Beispiele für JavaScript. Wenn Ihr Team JS-native arbeitet, hilft der Skill weiterhin bei Konzepten und der Zerlegung von Aufgaben — die stärkste operative Unterstützung liegt aber in Python.

Kann dieser Skill mit gescannten PDFs umgehen?

Teilweise. Er kann dabei helfen, Seiten in Bilder zu rendern und Workflows um visuelle Verarbeitung herum aufzubauen. Bei gescannten PDFs sind die Ergebnisse jedoch oft stark von OCR oder visueller Platzierungslogik abhängig und damit stark von der Dokumentqualität und den nachgelagerten Tools beeinflusst.

So verbessern Sie den pdf skill

Mit der richtigen PDF-Diagnose starten

Der beste Weg, die pdf-Nutzung zu verbessern, ist, das Dokument vorab richtig einzuordnen:

textbasiert vs. gescannt
ausfüllbar vs. nicht ausfüllbar
Dokumentextraktion vs. Formularbefüllung
visuelle Treue vs. Texttreue

Die meisten Fehler entstehen durch die Wahl des falschen Pfads, nicht durch schlechte Codesyntax.

Bessere Aufgabeninputs liefern

Bessere Eingaben führen zu besseren Ergebnissen. Geben Sie nach Möglichkeit an:

einen Beispieldateinamen
die Seitenanzahl
ob Tabellen, Formulare oder Unterschriften enthalten sind
ob Sie editierbare Ausgabe oder nur extrahierte Daten benötigen
die exakten Felder zum Ausfüllen, idealerweise als JSON-Mapping

Gerade bei Formularen ist das deutlich besser als eine Prosa-Liste, weil die Skripte und Workflows ganz natürlich auf strukturierte Daten abbilden.

Vor dem Hochskalieren validieren

Testen Sie nicht zuerst mit 200 PDFs. Führen Sie den pdf skill zunächst mit einer repräsentativen Datei aus und prüfen Sie:

die Qualität der Textextraktion
die Vollständigkeit der Feldmetadaten
das Rendering der Seitenbilder
Warnungen zu Bounding-Box-Überlappungen
die finale visuelle Ausgabe

Diese Validierung im kleinen Umfang fängt die Fehler ab, die später teuer werden.

Häufige Fehlerbilder in pdf-Workflows

Achten Sie besonders auf diese Punkte:

anzunehmen, dass ein PDF ausfüllbar ist, ohne es zu prüfen
Textextraktion auf gescannte Dateien anzuwenden und nahezu leere Ausgabe zu erhalten
Feldwerte zu schreiben, ohne zuerst Feld-IDs und Feldtypen zu prüfen
Validierungsbilder für nicht ausfüllbare Formulare zu überspringen
Rendering-Output so zu behandeln, als wäre er strukturierte Textextraktion

Genau in diesen Bereichen helfen die Skripte des Repositorys.

Prompts verbessern, indem Sie nach dem vollständigen Workflow fragen

Ein besserer Prompt für pdf for PDF Processing fordert den Agenten dazu auf:

den Dokumenttyp zu identifizieren
den passenden Bibliotheks-/Tool-Pfad auszuwählen
Zwischenergebnisse zu zeigen
vor dem Finalisieren zu validieren

Beispiel:
„Nutze den pdf skill, um application.pdf zu prüfen. Kontrolliere zuerst, ob ausfüllbare Felder vorhanden sind. Falls ja, extrahiere die Feldmetadaten und schlage ein JSON-Payload zum Ausfüllen vor. Falls nein, konvertiere jede Seite in Bilder, identifiziere die Eingabebereiche, erzeuge ein Validierungsbild für Seite 1 und schlage erst danach den Befüllungsansatz vor.“

Diese Art von Prompt verbessert sowohl die Genauigkeit als auch das Vertrauen in das Ergebnis.

Nach dem ersten Output gezielt iterieren

Wenn das erste Ergebnis schwach ist, bitten Sie nicht einfach nur um „besser“. Fordern Sie eine engere Korrektur an:

„Führe es erneut mit gerenderten Bildern aus, weil die Textextraktion kaum Inhalt geliefert hat.“
„Liste alle Checkbox- und Radio-Felder getrennt auf.“
„Erzeuge Validierungs-Overlays für die Seiten 2 und 3.“
„Behalte die ursprüngliche Seitenreihenfolge bei und gib eine Datei pro Seite aus.“

Solche konkreten Iterationswünsche machen den pdf skill deutlich wirkungsvoller als unspezifische Wiederholungen.

Repository-Skripte als Wahrheitsanker nutzen

Wenn die Agent-Ausgabe und die Dokumentrealität voneinander abweichen, sollten Sie den Repository-Skripten mehr vertrauen als freiem Reasoning. Bei diesem Skill sind die Skripte die stärkste Quelle operativer Wahrheit, weil sie die erwarteten Eingaben, Feldstrukturen und Validierungsprüfungen definieren.

Den Einführungs-Trade-off verstehen

Das pdf install lohnt sich, wenn PDF-Formulare, layoutsensitive Workflows oder wiederkehrende Dokumentverarbeitung Teil Ihrer Arbeit sind. Wenn Ihr Anwendungsfall nur gelegentliches Zusammenführen von Seiten ist, reicht ein generischer Prompt möglicherweise aus. Der Skill zahlt sich vor allem dann aus, wenn Sie reproduzierbares, validiertes PDF Processing statt einmaliger Tipps benötigen.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

kreuzberg

von kreuzberg-dev

Die kreuzberg-Skill hilft dir, Kreuzberg zu installieren und für die Dokumentextraktion aus über 91 Formaten zu nutzen – darunter PDFs, Office-Dateien, Bilder, HTML, E-Mails und Archive. Abgedeckt werden Python-, Node.js-/TypeScript-, Rust- und CLI-Workflows für OCR, Tabellen, Metadaten, Stapelverarbeitung und praxisnahe Hinweise zum Parsen.

PDF Processing

Favoriten 0GitHub 0

azure-ai-document-intelligence-ts

von microsoft

azure-ai-document-intelligence-ts ist ein TypeScript-Skill zum Extrahieren von Text, Tabellen, Key-Value-Feldern und strukturierten Daten mit Azure Document Intelligence. Nutzen Sie ihn für OCR-Extraktion aus Rechnungen, Belegen, Ausweisen und Formularen oder wenn Sie in Node.js Workflows mit vortrainierten und benutzerdefinierten Modellen und Azure REST SDK-Authentifizierung benötigen.

OCR Extraction

Favoriten 0GitHub 2.3k

azure-ai-contentunderstanding-py

von microsoft

azure-ai-contentunderstanding-py ist das Python-Skill für Azure AI Content Understanding. Es extrahiert strukturierte Inhalte aus Dokumenten, Bildern, Audio und Video für RAG-Workflows und Automatisierung. Nutzen Sie es, wenn Sie zuverlässige multimodale Extraktion, Azure-Authentifizierung und reproduzierbare, pipelinefähige Ausgaben benötigen.

RAG Workflows

Favoriten 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

von microsoft

azure-ai-document-intelligence-dotnet hilft .NET-Entwicklern, Azure AI Document Intelligence zu installieren und zu nutzen, um Text, Tabellen, Key-Value-Paare und strukturierte Felder aus Rechnungen, Belegen, Ausweisen und benutzerdefinierten Dokumenten zu extrahieren. Enthalten sind praxisnahe Hinweise zu Einrichtung, Authentifizierung und OCR-Extraktion für eine zuverlässige Dokumentenanalyse.

OCR Extraction

Favoriten 0GitHub 2.2k

nutrient-document-processing

von PSPDFKit-labs

nutrient-document-processing ist ein Workflow-Skill für PDF-Verarbeitung mit Nutrient DWS. Er hilft dabei, wiederholbare Dokument-Workflows zum Konvertieren, Zusammenführen, Teilen, OCRen, Extrahieren, Schwärzen, Signieren, Optimieren und für Compliance-Ausgaben wie PDF/A oder PDF/UA zu installieren, zu verstehen und anzuwenden.

PDF Processing

Favoriten 0GitHub 0

visa-doc-translate

von affaan-m

visa-doc-translate übersetzt Bilder von Visumanträgen ins Englische und erstellt ein zweisprachiges PDF mit der Originalseite und der Übersetzung. Die Skill ist für strukturierte Visa-Unterlagen gebaut und unterstützt OCR-Fallback, Rotationskorrektur sowie die zuverlässige Übernahme von Namen, Daten und Beträgen.

Translation

Favoriten 0GitHub 156.3k

nutrient-document-processing

von affaan-m

nutrient-document-processing Skill für PDF-Verarbeitung und Dokumentenautomatisierung mit der Nutrient DWS API. Konvertieren, OCRen, extrahieren, schwärzen, signieren, mit Wasserzeichen versehen und Dateien wie PDFs, DOCX, XLSX, PPTX, HTML und Bilder ausfüllen.

PDF Processing

Favoriten 0GitHub 156.2k

hv-analysis

von KKKKhazix

hv-analysis ist ein horizontale-vertikale Recherche-Skill, mit dem sich ein Produkt, ein Unternehmen, ein Konzept, eine Technologie oder eine Person in einen strukturierten Analysebericht überführen lässt. Nutze den hv-analysis-Skill für Deep Research, Wettbewerbsvergleiche und ausgabefertige Berichte – besonders dann, wenn du hv-analysis für Datenanalyse oder einen sauber aufbereiteten PDF-Workflow benötigst.

Data Analysis

Favoriten 0GitHub 9k

azure-ai-formrecognizer-java

von microsoft

Die azure-ai-formrecognizer-java Skill hilft Java-Entwicklern dabei, Azure AI Document Intelligence für OCR-Extraktion, Tabellen, Schlüssel-Wert-Paare, Rechnungen, Belege, Ausweise und benutzerdefinierte Dokumentmodelle zu nutzen. Sie ist auf das aktuelle SDK com.azure:azure-ai-documentintelligence ausgerichtet und besonders hilfreich, wenn Sie eine praxistaugliche Java-Einrichtung, API-Hinweise und wiederholbare Dokumentanalyse benötigen.

OCR Extraction

Favoriten 0GitHub 2.2k

markitdown

von K-Dense-AI

markitdown konvertiert Dateien und Office-Dokumente in Markdown, damit Inhalte leichter lesbar, in Chunks aufteilbar und durchsuchbar sind und sich besser in LLM-Workflows nutzen lassen. Diese markitdown-Skill unterstützt PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, Bilder mit OCR und Audio-Transkription und ist damit ein praktischer markitdown-Leitfaden für die Formatkonvertierung.

Format Conversion

Favoriten 0GitHub 0

analyzing-malicious-pdf-with-peepdf

von mukul975

analyzing-malicious-pdf-with-peepdf ist eine Skill für statische Malware-Analyse verdächtiger PDFs. Verwende peepdf, pdfid und pdf-parser, um Phishing-Anhänge zu sichten, Objekte zu prüfen, eingebettetes JavaScript oder Shellcode zu extrahieren und verdächtige Streams sicher ohne Ausführung zu untersuchen.

Malware Analysis

Favoriten 0GitHub 0

analyzing-pdf-malware-with-pdfid

von mukul975

analyzing-pdf-malware-with-pdfid ist ein Skill für die Triage von PDF-Malware, um eingebettetes JavaScript, Exploit-Indikatoren, Objektströme, Anhänge und verdächtige Aktionen vor dem Öffnen einer Datei zu erkennen. Er unterstützt die statische Analyse für die Untersuchung bösartiger PDFs, Incident Response und Analyzing-PDF-Malware-with-pdfid für Security-Audit-Workflows.

Security Audit

Favoriten 0GitHub 0

pdf

von openai

Nutzen Sie die pdf skill für PDF-Verarbeitungsaufgaben, bei denen Layout, Seitenaufteilung und gerenderte Ausgabe wichtig sind. Sie hilft dabei, PDFs in einem visuell orientierten Workflow zu lesen, zu erstellen, zu bearbeiten und zu prüfen: Seiten rendern, das Ergebnis ansehen und dann gezielt anpassen. Verwenden Sie sie, wenn Sie eine verlässliche PDF-Installation, eine praktische pdf-Nutzung und einen brauchbaren pdf-Leitfaden für dokumentgenaue Arbeit brauchen.

PDF Processing

Favoriten 0GitHub 0

pdf

von K-Dense-AI

Das pdf-Skill ist ein praxisnaher Leitfaden für PDF-Processing, wenn Sie PDF-Dateien in einem belastbaren Workflow lesen, extrahieren, umwandeln oder erstellen müssen. Es behandelt Text-Extraktion, Zusammenführen, Teilen, Rotieren, Ausfüllen von Formularen, Verschlüsselung, Bild-Extraktion und OCR für gescannte PDFs. Nutzen Sie es, wenn Sie statt eines einmaligen Prompts einen wiederverwendbaren pdf-Leitfaden brauchen.

PDF Processing

Favoriten 0GitHub 0

Resume Formatter

von Paramchoudhary

Resume Formatter hilft dabei, unstrukturierte Lebensläufe in saubere, ATS-freundliche Dokumente mit klarer Hierarchie, ausgewogenem Abstand und professionellem Aufbau zu verwandeln. Es eignet sich für Resume Formatter für Resume Writing, Bewerbungen und Neugestaltungen, die sowohl am Bildschirm als auch auf Papier gut lesbar bleiben müssen.

Resume Writing

Favoriten 0GitHub 443

minimax-pdf

von MiniMax-AI

Die minimax-pdf-Skill hilft dir, ansprechende PDFs zu erstellen, auszufüllen oder umzubauen, wenn visuelle Qualität und Dokumentenidentität wichtig sind. Nutze sie für CREATE-, FILL- oder REFORMAT-Workflows mit einem tokenbasierten Designsystem, das Rohmaterial in druckreife Ergebnisse verwandelt. Dieser Leitfaden behandelt die Installation von minimax-pdf, die Nutzung von minimax-pdf und die Wahl der passenden Route für bessere Ergebnisse.

PDF Processing

Favoriten 0GitHub 0