docx
von anthropicsInstalliere und nutze den docx Skill, um Word-.docx-Dateien zu erstellen, zu prüfen, zu bearbeiten, zu validieren, zu kommentieren und in praktischen Dokument-Workflows zu konvertieren.
Overview
Was der docx Skill leistet
Der docx Skill ist für durchgängige Workflows mit Microsoft Word-.docx-Dateien ausgelegt. Er eignet sich für Szenarien, in denen du Word-Dokumente erstellen, lesen, bearbeiten, analysieren, validieren, kommentieren oder neu paketieren musst – also nicht nur einfachen Text erzeugen willst.
Die Materialien im Repository zeigen einen praxisnahen XML-basierten Workflow für Office-Dateien mit klarem Fokus auf Word: .docx-Archive entpacken, das interne XML bearbeiten, Dateien neu packen, die Struktur validieren, Kommentare hinzufügen und mit nachverfolgten Änderungen arbeiten. Außerdem enthält der Skill Hinweise und Hilfsmittel, um ältere .doc-Dateien vor der Bearbeitung in .docx zu konvertieren.
Für wen dieser Skill gedacht ist
Dieser Skill passt besonders gut für:
- Teams, die professionell aufbereitete Word-Dokumente wie Berichte, Memos, Briefe und Vorlagen erstellen
- Nutzer, die bestehende
.docx-Dateien prüfen oder transformieren müssen, statt bei null zu beginnen - Workflows, bei denen Word-native Funktionen wie Kommentare oder nachverfolgte Änderungen erhalten bleiben müssen
- Aufgaben der Dokumentautomatisierung, bei denen direkter XML-Zugriff verlässlicher ist als manuelle Bearbeitung
Welche Probleme der docx Skill löst
Nutze docx, wenn du:
- Inhalte aus einer vorhandenen
.docxlesen musst - eine Word-Datei in bearbeitbares XML entpacken willst
- strukturierte Änderungen vornehmen und das Dokument anschließend neu aufbauen musst
- Review-Kommentare in ein Dokumentpaket einfügen willst
- nachverfolgte Änderungen mit LibreOffice-basierten Tools übernehmen musst
- eine neu erstellte Office-Datei vor der Übergabe validieren willst
- eine ältere
.doc-Datei in.docxumwandeln musst, damit sie sicher verarbeitet werden kann
So funktioniert es auf hoher Ebene
Die Grundidee hinter docx ist, dass eine .docx-Datei ein ZIP-Archiv mit XML und zugehörigen Assets ist. Das Repository enthält unter anderem folgende Skripte:
scripts/office/unpack.pyzum Extrahieren und formatierten Ausgeben von Office-Dokumentinhaltenscripts/office/pack.pyzum Neuaufbauen von.docx-,.pptx- oder.xlsx-Dateien aus einem entpackten Verzeichnisscripts/office/validate.pyund Validierungs-Module unterscripts/office/validators/zur Prüfung der Dokumentstrukturscripts/comment.pyzum Hinzufügen von Word-Kommentaren in ein entpacktes Dokumentscripts/accept_changes.pyzum Übernehmen nachverfolgter Änderungen mit LibreOfficescripts/office/soffice.py, umsofficein eingeschränkten Umgebungen zuverlässiger auszuführen
Wann docx besonders gut passt
Wähle docx, wenn deine Hauptaufgabe die Bearbeitung von Word-Dokumenten ist. Besonders nützlich ist der Skill, wenn ein Nutzer ausdrücklich eine Word-Datei verlangt, sich auf .docx bezieht oder Word-spezifische Funktionen benötigt, etwa:
- Überschriften, Seitenzahlen und professionelle Formatierung
- Extraktion oder Neuorganisation von Dokumentinhalten
- Kommentare und Review-Workflows
- Umgang mit nachverfolgten Änderungen
- Änderungen auf XML-Ebene für präzise Transformationen
Wann docx nicht die beste Wahl ist
Für jeden Datei-Workflow ist dieser Skill nicht die richtige Wahl. Weniger geeignet ist er, wenn du vor allem Folgendes brauchst:
- PDF-zentrierte Verarbeitung
- Tabellenkalkulationen oder Präsentationen als Hauptaufgabe
- Zusammenarbeit in Google Docs statt Bearbeitung von Office-Paketen
- allgemeine Programmierhilfe ohne Bezug zu Dokumenterstellung oder -transformation
Installationsüberblick
Um den docx Skill aus dem Anthropic skills repository zu installieren, verwende:
npx skills add https://github.com/anthropics/skills --skill docx
Nach der Installation solltest du zuerst SKILL.md lesen und anschließend die unterstützenden Skripte unter scripts/ prüfen, um die verfügbaren Dokumentoperationen zu verstehen.
How to Use
Den docx Skill installieren
Installiere docx mit:
npx skills add https://github.com/anthropics/skills --skill docx
Sieh dir danach zuerst diese Dateien an:
SKILL.mdscripts/office/unpack.pyscripts/office/pack.pyscripts/office/validate.pyscripts/comment.pyscripts/accept_changes.pyscripts/office/soffice.py
Diese Dateien zeigen den tatsächlichen Arbeitsablauf des Skills und sind der beste Ausgangspunkt, um die Installation sinnvoll zu bewerten.
Voraussetzungen prüfen, bevor du dich festlegst
Die Informationen im Repository sprechen für einige praktische Abhängigkeiten und Annahmen:
- Für die enthaltenen Skripte wird Python benötigt
- Für einige Operationen wird LibreOffice
sofficebenötigt, darunter das Skript zum Übernehmen nachverfolgter Änderungen und der Workflow zur Konvertierung von.docnach.docx - Für die Textextraktion aus
.docxwird aufpandocverwiesen
Wenn deine Umgebung keine Python-Skripte oder LibreOffice ausführen kann, kann docx konzeptionell zwar weiterhin nützlich sein, der enthaltene Workflow ist dann aber deutlich weniger komfortabel.
Typischer Workflow: prüfen, bearbeiten, neu aufbauen
Ein typischer docx-Workflow sieht so aus:
- Ältere
.doc-Dateien bei Bedarf in.docxkonvertieren. - Das
.docx-Archiv in ein Arbeitsverzeichnis entpacken. - Das extrahierte XML und zugehörige Assets bearbeiten.
- Optional Kommentare hinzufügen oder Markups bearbeiten.
- Das Verzeichnis wieder zu einer neuen
.docxpacken. - Das neu aufgebaute Dokument validieren.
Dieser Ansatz eignet sich besonders für wiederholbare Dokumenttransformationen, bei denen Präzision wichtiger ist als interaktive Bearbeitung in Word.
Legacy-.doc-Dateien zuerst konvertieren
Die Skill-Dokumentation weist ausdrücklich darauf hin, dass ältere .doc-Dateien vor der Bearbeitung konvertiert werden sollten. Der dokumentierte Befehl lautet:
python scripts/office/soffice.py --headless --convert-to docx document.doc
Wenn deine Eingabedateien ältere binäre Word-Dateien statt moderner .docx-Dateien sind, ist dieser Konvertierungsschritt wichtig für einen stabilen Workflow.
Dokumentinhalte lesen
Zum Lesen und Analysieren von Dokumenten nennt das Repository zwei praktische Optionen:
- Verwende
pandoc, wenn du extrahierten Text benötigst, einschließlich der Verarbeitung nachverfolgter Änderungen - Entpacke das Dokument, wenn du direkten Zugriff auf das rohe XML brauchst
Damit ist docx sowohl für Inhaltsanalysen als auch für strukturbewusste Bearbeitung nützlich.
Ein Word-Dokument zur Bearbeitung entpacken
Das Entpack-Skript ist die Grundlage des Bearbeitungs-Workflows. Es extrahiert das Office-Archiv, formatiert XML-Dateien lesbar und kann bei DOCX-Dateien optional benachbarte Runs zusammenführen oder nachverfolgte Änderungen vereinfachen.
Ein typisches Nutzungsmuster aus dem Repository ist:
python unpack.py document.docx unpacked/
Die eigentliche Skriptdatei ist scripts/office/unpack.py; in der Praxis wirst du sie also meist von dort aus ausführen oder an deine Umgebung anpassen.
XML mit Bedacht bearbeiten
Nach dem Entpacken arbeitest du direkt mit den WordprocessingML-Dateien im extrahierten Verzeichnis. Das eignet sich besonders für kontrollierte Änderungen wie:
- Text an bekannten XML-Positionen ersetzen
- Dokumentmetadaten oder -struktur anpassen
- Referenzen für Kommentare einfügen
- ein bereinigtes Paket für nachgelagerte Generierung vorbereiten
Das passt sehr gut zu Automatisierungs-Engineering und agentengestützten Workflows, ist aber weniger ideal für gelegentliche Einzelbearbeitungen durch nichttechnische Nutzer.
Kommentare zu einem DOCX-Paket hinzufügen
Das Repository enthält scripts/comment.py, um Kommentare zu entpackten DOCX-Inhalten hinzuzufügen. Laut Skriptdokumentation lassen sich Kommentare ergänzen und Antworten über eine Parent-Comment-Referenz zuordnen.
Ein praktisches Detail aus dem Quellmaterial: Kommentartext muss XML-escaped sein, und die Kommentar-Markierungen müssen auch in document.xml korrekt gesetzt werden. Das bedeutet, dass docx für programmatische Review-Workflows gut geeignet ist, aber einen sorgfältigen Umgang mit den XML-Konventionen von Word voraussetzt.
Nachverfolgte Änderungen übernehmen
Wenn du eine bereinigte Fassung eines überprüften Word-Dokuments benötigst, ist scripts/accept_changes.py dafür gedacht, alle nachverfolgten Änderungen mit LibreOffice zu übernehmen. Laut Quelle ist LibreOffice dafür zwingend erforderlich.
Das ist einer der wichtigeren Punkte bei der Installationsentscheidung für docx: Wenn dein Workflow von der Auflösung nachverfolgter Änderungen abhängt, bietet das enthaltene Skript einen automatisierten Weg, ohne dass Änderungen manuell in Word übernommen werden müssen.
Die finale Datei neu packen und validieren
Sobald die Bearbeitung abgeschlossen ist, baut scripts/office/pack.py die Office-Datei neu auf. Laut Quelle kann das Skript validieren, automatisch reparieren, XML-Formatierung verdichten und ein .docx-, .pptx- oder .xlsx-Paket schreiben.
Für Word-Workflows liegt der Hauptnutzen darin, nach direkten XML-Änderungen wieder eine gültige .docx zu erzeugen. Die Validierung ist wichtig, weil Office-Dateien nach manuellen Änderungen am Paket auf subtile Weise fehlschlagen können.
Aspekte zu Umgebung und Sandbox
scripts/office/soffice.py enthält Hilfslogik, um LibreOffice in Umgebungen auszuführen, in denen AF_UNIX-Sockets eingeschränkt sein können. Das ist ein nützliches Implementierungsdetail, wenn du Dokument-Workflows in Containern, Remote-Sandboxes oder VM-basierten Automatisierungs-Setups betreibst.
Kurz gesagt: Bei docx geht es nicht nur um Befehle zur Dokumentbearbeitung; der Skill bringt auch operative Werkzeuge mit, damit diese Befehle in weniger vorhersehbaren Laufzeitumgebungen zuverlässig funktionieren.
Beste Einsatzszenarien für Teams
Der docx Skill ist besonders passend, wenn dein Team Folgendes benötigt:
- wiederholbare Erstellung oder Bereinigung von Word-Dokumenten
- automatisierte Reviews und das Einfügen von Kommentaren
- Transformationen auf XML-Ebene, die sich mit gewöhnlichem Office-Scripting nicht sauber umsetzen lassen
- Validierung vor der Übergabe an Kunden oder interne Stakeholder
- Migration älterer
.doc-Bestände in moderne.docx-Workflows
Gründe für einen anderen Ansatz
Du solltest möglicherweise ein anderes Tool wählen, wenn:
- du nur einen einfachen Textexport brauchst und dir Word-native Genauigkeit nicht wichtig ist
- Nutzer überwiegend interaktiv in Word arbeiten, statt über Automatisierung
- du einen vollständig offenen, redistribuierbaren Library-Workflow statt skillgebundener Materialien benötigst
- deine Umgebung die notwendige Python- und LibreOffice-Toolchain nicht unterstützt
FAQ
Wofür wird der docx Skill hauptsächlich verwendet?
docx wird hauptsächlich für Word-.docx-Workflows verwendet: zum Erstellen, Lesen, Bearbeiten, Validieren, Kommentieren und Transformieren von Word-Dokumenten. Besonders nützlich ist der Skill, wenn eine Aufgabe von Word-spezifischer Struktur statt von reinem Text abhängt.
Wie installiere ich den docx Skill?
Installiere den Skill mit npx skills add https://github.com/anthropics/skills --skill docx. Danach solltest du SKILL.md und die Skripte unter scripts/ prüfen, um den unterstützten Workflow zu verstehen.
Unterstützt docx ältere .doc-Dateien?
Ja, aber indirekt. Die Hinweise im Repository sagen, dass ältere .doc-Dateien vor der Bearbeitung mit dem LibreOffice-basierten Workflow über scripts/office/soffice.py in .docx konvertiert werden sollten.
Kann docx mit nachverfolgten Änderungen umgehen?
Ja. Die Informationen im Repository zeigen Unterstützung für Workflows rund um nachverfolgte Änderungen. scripts/accept_changes.py übernimmt diese Änderungen mit LibreOffice, und der Entpack-Workflow kann benachbarte nachverfolgte Änderungen in DOCX-Dateien vereinfachen.
Kann ich mit dem docx Skill Kommentare hinzufügen?
Ja. scripts/comment.py ist ausdrücklich dafür enthalten, Kommentare zu DOCX-Dokumenten hinzuzufügen, einschließlich Antwortbeziehungen. Das ist eine der klarsten Word-Review-Funktionen, die der Skill bietet.
Validiert docx Dokumente nach der Bearbeitung?
Ja. Das Repository enthält Validierungslogik unter scripts/office/validate.py und scripts/office/validators/. Auch der Pack-Prozess unterstützt die Validierung beim Neuaufbau von Dateien.
Ist docx nur für Word-Dateien gedacht?
Der docx Skill ist klar auf Word ausgerichtet, aber einige Hilfsskripte unter scripts/office/ unterstützen auch das Paketieren und Validieren von .pptx- und .xlsx-Dateien. Für die Installationsentscheidung liegt der Hauptwert von docx aber klar in der Arbeit mit DOCX-Dokumenten.
Ist docx gut für nichttechnische Nutzer geeignet?
In der Regel nicht als primäres Bearbeitungswerkzeug. docx eignet sich am besten für technische, agentengestützte oder stark automatisierte Workflows, weil es auf dem Entpacken von Office-Dateien, dem Bearbeiten von XML und dem erneuten Packen basiert. Wer nur schnell eine manuelle Änderung vornehmen will, ist in Word selbst oft besser aufgehoben.
Was sollte ich mir im Repository zuerst ansehen?
Beginne mit SKILL.md und sieh dir dann scripts/office/unpack.py, scripts/office/pack.py, scripts/comment.py, scripts/accept_changes.py und die Validierungs-Module an. So bekommst du ein realistisches Bild davon, ob der docx Skill zu deinem Workflow und deiner Laufzeitumgebung passt.
