defuddle
von kepanodefuddle extrahiert mit der Defuddle CLI sauberes Markdown aus Webseiten und entfernt dabei störenden Ballast für Recherche, Dokumentation und Artikel. Geeignet für normale HTML-Seiten, installierbar mit npm; URLs mit der Endung .md solltest du überspringen.
Dieser Skill erreicht 76/100 und ist damit ein solider Kandidat für ein Verzeichnis: Agents bekommen einen klaren Auslöser, ein einfaches Befehlsmuster und einen konkreten Grund, ihn bei normalen Webseiten statt eines generischen Web-Fetches zu verwenden. Nutzer des Verzeichnisses können eine belastbare Installationsentscheidung treffen, sollten aber eher einen schlanken Wrapper um eine externe CLI als einen tief geführten Workflow erwarten.
- Hohe Auslösbarkeit: Es wird klar benannt, dass Defuddle genutzt werden soll, wenn ein Nutzer eine normale Web-URL zum Lesen oder Analysieren angibt, nicht aber bei URLs mit der Endung .md.
- Operativ klar: Der Skill bietet Installationshinweise sowie konkrete Befehle für Markdown-Extraktion, Dateiausgabe und das Abrufen von Metadaten.
- Guter Hebel für Agents: Der praktische Vorteil wird deutlich erklärt – Navigation, Werbung und sonstiger Ballast werden entfernt, was den Token-Verbrauch gegenüber dem Abruf der Rohseite senken kann.
- Begrenzte Hinweise zu Sonderfällen: Abgesehen vom Ausschluss von .md-URLs wird nicht erklärt, wie mit Fehlern, nicht unterstützten Seiten, Auth-Schranken oder dynamischen Websites umzugehen ist.
- Wenig Begleitmaterial: Es gibt keine Skripte, Referenzen oder Beispiele mit erwarteten Ausgaben; die Einführung stützt sich daher allein auf die kurze SKILL.md.
Überblick über den defuddle skill
Was der defuddle skill macht
Der defuddle skill wandelt eine normale Webseite in sauberes, gut lesbares Markdown um – mit deutlich weniger Ballast als bei einem rohen Fetch. Er ist für Seiten wie Artikel, Dokumentation, Anleitungen, Blogposts und andere HTML-Seiten gedacht, bei denen Menüs, Werbung, Sidebars und Navigation nur Tokens verbrauchen und die Analyse stören.
Wann defuddle für Web Research am besten passt
Nutze defuddle für Web Research, wenn dein eigentliches Ziel darin besteht, Seiteninhalte zu lesen, zusammenzufassen, zu vergleichen, zu zitieren oder zu analysieren – nicht darin, Site-Chrome oder rohes HTML zu untersuchen. Der Hauptnutzen liegt in saubererem Input für nachgelagerte Auswertung. Wenn dir jemand eine normale Seiten-URL gibt und den Inhalt daraus braucht, ist defuddle usage meist der bessere Einstieg als ein generischer Web-Fetch.
Wichtige Grenzen und wann du es nicht verwenden solltest
Die wichtigste Grenze ist einfach: Verwende defuddle nicht für URLs, die auf .md enden. Diese Seiten liegen bereits als Markdown vor, daher ist ein direkter Fetch sauberer und vermeidet unnötige Umwandlung. Ebenfalls ungeeignet ist es, wenn du die exakte Seitenstruktur, interaktive Elemente, Skripte oder vollständige DOM-Treue brauchst.
Warum Nutzer sich für defuddle entscheiden
Der praktische Unterschied ist nicht „kann es eine Seite abrufen“, sondern „liefert es mir den Hauptinhalt schnell in einem token-effizienten Format“. Genau das macht den defuddle skill attraktiv für Research-Pipelines, Notizerfassung, Artikelsummaries und das Lesen von Dokumentation, bei denen saubereres Markdown die Ausgabequalität spürbar verbessert.
So verwendest du den defuddle skill
defuddle installieren und Grundbefehl
Für defuddle install verweist das Repository direkt auf die Defuddle CLI:
npm install -g defuddle
Zentraler Befehl:
defuddle parse <url> --md
Verwende --md konsequent. Das ist für die meisten Research- und Analyse-Workflows das empfohlene Ausgabeformat, weil es visuelles Rauschen entfernt und zugleich eine gut lesbare Struktur erhält.
Welche Eingaben der defuddle skill braucht
Der defuddle skill benötigt eine Seiten-URL und idealerweise eine klare Absicht. Gute Eingaben enthalten:
- die genaue URL
- was du daraus brauchst
- ob du vollständiges Markdown, gespeicherte Ausgabe oder nur Metadaten willst
Beispiele:
- „Lies diesen Artikel und fasse die Hauptaussage zusammen:
<url>“ - „Extrahiere sauberes Markdown aus dieser Dokumentationsseite und speichere es in
content.md:<url>“ - „Hole für
<url>nur Seitentitel und Beschreibung“
Nützliche Befehle:
defuddle parse <url> --md -o content.md
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain
Aus einem vagen Ziel einen guten defuddle Prompt machen
Schwache Anfrage: „Schau dir diese URL an.“
Besserer defuddle guide Prompt:
- „Use defuddle on
<url>with markdown output. Ignore site navigation. Then summarize the key points in 5 bullets and quote the most important section.“ - „Use defuddle for this documentation page:
<url>. Extract markdown, identify setup steps, prerequisites, and caveats, then rewrite them as a checklist.“ - „Pull only metadata from
<url>first. If the title and description match the topic, then extract full markdown.“
Das funktioniert besser, weil es dem Agenten sowohl vorgibt, wie defuddle aufgerufen werden soll, als auch, was mit dem bereinigten Inhalt anschließend passieren soll.
Empfohlener Workflow und was du zuerst lesen solltest
Dieser Skill ist bewusst klein gehalten. Lies zuerst skills/defuddle/SKILL.md, denn dort steht der komplette nutzbare Workflow: Installation, Parse-Befehl, Ausgabeformate und Metadaten-Eigenschaften. In der Praxis ist diese Reihenfolge sinnvoll:
- Prüfen, ob die URL eine normale HTML-Seite oder eine
.md-Datei ist. defuddle parse <url> --mdausführen.- Wenn du ein wiederverwendbares Artefakt brauchst,
-o content.mdergänzen. - Wenn du nur Routing oder Validierung brauchst, Metadaten mit
-pabfragen. - Das bereinigte Markdown in Zusammenfassung, Extraktion oder Notizerfassung weitergeben.
FAQ zum defuddle skill
Ist defuddle besser als ein normaler Prompt plus Fetch?
Für artikelartige Seiten meistens ja. Ein normaler Fetch enthält oft Header, Footer, Cookie-Hinweise und Navigation. defuddle usage verbessert das Signal-Rausch-Verhältnis schon vor Beginn der Analyse, was Token-Kosten senken und Zusammenfassungsfehler durch irrelevante Seitenelemente reduzieren kann.
Wann sollte ich den defuddle skill nicht verwenden?
Überspringe defuddle bei .md-URLs, Rohdateien oder wenn du exaktes HTML, Verhalten eingebetteter Medien, Seitenskripte oder Layout-Details brauchst. Es ist ein Tool zur Inhalts-Extraktion, kein Werkzeug für Browser-Automation oder DOM-Inspektion.
Ist der defuddle skill einsteigerfreundlich?
Ja. Die Befehlsoberfläche ist sehr klein: einmal installieren, dann defuddle parse <url> --md verwenden. Dadurch lässt sich der defuddle skill auch dann leicht übernehmen, wenn du nur saubereren Quelltext für Research oder Notizen möchtest.
Welche Ausgaben kann defuddle zurückgeben?
Du kannst Markdown mit --md, JSON mit --json, standardmäßig HTML oder gezielte Metadaten mit -p <name> erhalten. Für die meisten Lese- und Research-Aufgaben ist Markdown die beste Standardeinstellung; der Metadaten-Modus eignet sich gut für schnelle Validierung und Weiterleitung.
So verbesserst du den defuddle skill
Dem defuddle skill ein präzises Seitenziel geben
Der einfachste Weg, defuddle bessere Ergebnisse zu entlocken, ist eine kanonische Inhaltsseite anzugeben – nicht die Startseite, eine Suchseite oder eine Übersichtsseite. Artikel-URLs und einzelne Doku-Seiten liefern saubereres Markdown als Hubs voller Navigation und wiederholter Links.
Die nachgelagerte Aufgabe direkt in derselben Anfrage nennen
Der defuddle skill ist stärker, wenn die Extraktion direkt mit einem konkreten nächsten Schritt verknüpft ist. Statt nur „parse this“ zu sagen, frage nach:
- Zusammenfassung
- Kernaussagen
- Setup-Schritten
- FAQs
- Zitaten
- Vergleichspunkten
Das reduziert Unklarheiten bei der Übergabe und hilft dem Agenten, die Ausgabe an deiner eigentlichen Aufgabe auszurichten.
Bei Unsicherheit erst den Metadaten-Modus nutzen, dann vollständig extrahieren
Wenn die URL weiterleiten könnte, qualitativ fraglich ist oder womöglich die falsche Seite trifft, starte mit:
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain
Das ist eine einfache, aber wirksame defuddle guide-Taktik: erst Relevanz prüfen, dann Aufwand in die vollständige Markdown-Extraktion investieren.
Typische Fehlerbilder und wie du sinnvoll iterierst
Wenn die Ausgabe zu dünn wirkt oder seltsam strukturiert ist, liegt das Problem oft an der Quellseite, nicht an der CLI. Probiere eine spezifischere URL, wechsle von einer Kategorieseite zu einer Artikelseite oder speichere das Markdown, um es manuell zu prüfen. Wenn dein erstes Ergebnis zu breit ist, führe defuddle für Web Research noch einmal mit engerer Anweisung aus, etwa „extract setup steps only“ oder „quote sections about authentication only“.
