defuddle

von kepano

defuddle extrahiert mit der Defuddle CLI sauberes Markdown aus Webseiten und entfernt dabei störenden Ballast für Recherche, Dokumentation und Artikel. Geeignet für normale HTML-Seiten, installierbar mit npm; URLs mit der Endung .md solltest du überspringen.

Stars19.7k

Favoriten0

Kommentare0

Hinzugefügt5. Apr. 2026

KategorieWeb Research

Installationsbefehl

npx skills add kepano/obsidian-skills --skill defuddle

Kurationswert

Dieser Skill erreicht 76/100 und ist damit ein solider Kandidat für ein Verzeichnis: Agents bekommen einen klaren Auslöser, ein einfaches Befehlsmuster und einen konkreten Grund, ihn bei normalen Webseiten statt eines generischen Web-Fetches zu verwenden. Nutzer des Verzeichnisses können eine belastbare Installationsentscheidung treffen, sollten aber eher einen schlanken Wrapper um eine externe CLI als einen tief geführten Workflow erwarten.

76/100

Stärken

Hohe Auslösbarkeit: Es wird klar benannt, dass Defuddle genutzt werden soll, wenn ein Nutzer eine normale Web-URL zum Lesen oder Analysieren angibt, nicht aber bei URLs mit der Endung .md.
Operativ klar: Der Skill bietet Installationshinweise sowie konkrete Befehle für Markdown-Extraktion, Dateiausgabe und das Abrufen von Metadaten.
Guter Hebel für Agents: Der praktische Vorteil wird deutlich erklärt – Navigation, Werbung und sonstiger Ballast werden entfernt, was den Token-Verbrauch gegenüber dem Abruf der Rohseite senken kann.

Hinweise

Begrenzte Hinweise zu Sonderfällen: Abgesehen vom Ausschluss von .md-URLs wird nicht erklärt, wie mit Fehlern, nicht unterstützten Seiten, Auth-Schranken oder dynamischen Websites umzugehen ist.
Wenig Begleitmaterial: Es gibt keine Skripte, Referenzen oder Beispiele mit erwarteten Ausgaben; die Einführung stützt sich daher allein auf die kurze SKILL.md.

Cli Npm Markdown Websites Documentation Blog Automation

Überblick

Überblick über den defuddle skill

Was der defuddle skill macht

Der defuddle skill wandelt eine normale Webseite in sauberes, gut lesbares Markdown um – mit deutlich weniger Ballast als bei einem rohen Fetch. Er ist für Seiten wie Artikel, Dokumentation, Anleitungen, Blogposts und andere HTML-Seiten gedacht, bei denen Menüs, Werbung, Sidebars und Navigation nur Tokens verbrauchen und die Analyse stören.

Wann defuddle für Web Research am besten passt

Nutze defuddle für Web Research, wenn dein eigentliches Ziel darin besteht, Seiteninhalte zu lesen, zusammenzufassen, zu vergleichen, zu zitieren oder zu analysieren – nicht darin, Site-Chrome oder rohes HTML zu untersuchen. Der Hauptnutzen liegt in saubererem Input für nachgelagerte Auswertung. Wenn dir jemand eine normale Seiten-URL gibt und den Inhalt daraus braucht, ist defuddle usage meist der bessere Einstieg als ein generischer Web-Fetch.

Wichtige Grenzen und wann du es nicht verwenden solltest

Die wichtigste Grenze ist einfach: Verwende defuddle nicht für URLs, die auf .md enden. Diese Seiten liegen bereits als Markdown vor, daher ist ein direkter Fetch sauberer und vermeidet unnötige Umwandlung. Ebenfalls ungeeignet ist es, wenn du die exakte Seitenstruktur, interaktive Elemente, Skripte oder vollständige DOM-Treue brauchst.

Warum Nutzer sich für defuddle entscheiden

Der praktische Unterschied ist nicht „kann es eine Seite abrufen“, sondern „liefert es mir den Hauptinhalt schnell in einem token-effizienten Format“. Genau das macht den defuddle skill attraktiv für Research-Pipelines, Notizerfassung, Artikelsummaries und das Lesen von Dokumentation, bei denen saubereres Markdown die Ausgabequalität spürbar verbessert.

So verwendest du den defuddle skill

defuddle installieren und Grundbefehl

Für defuddle install verweist das Repository direkt auf die Defuddle CLI:

npm install -g defuddle

Zentraler Befehl:

defuddle parse <url> --md

Verwende --md konsequent. Das ist für die meisten Research- und Analyse-Workflows das empfohlene Ausgabeformat, weil es visuelles Rauschen entfernt und zugleich eine gut lesbare Struktur erhält.

Welche Eingaben der defuddle skill braucht

Der defuddle skill benötigt eine Seiten-URL und idealerweise eine klare Absicht. Gute Eingaben enthalten:

die genaue URL
was du daraus brauchst
ob du vollständiges Markdown, gespeicherte Ausgabe oder nur Metadaten willst

Beispiele:

„Lies diesen Artikel und fasse die Hauptaussage zusammen: <url>“
„Extrahiere sauberes Markdown aus dieser Dokumentationsseite und speichere es in content.md: <url>“
„Hole für <url> nur Seitentitel und Beschreibung“

Nützliche Befehle:

defuddle parse <url> --md -o content.md
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

Aus einem vagen Ziel einen guten defuddle Prompt machen

Schwache Anfrage: „Schau dir diese URL an.“

Besserer defuddle guide Prompt:

„Use defuddle on <url> with markdown output. Ignore site navigation. Then summarize the key points in 5 bullets and quote the most important section.“
„Use defuddle for this documentation page: <url>. Extract markdown, identify setup steps, prerequisites, and caveats, then rewrite them as a checklist.“
„Pull only metadata from <url> first. If the title and description match the topic, then extract full markdown.“

Das funktioniert besser, weil es dem Agenten sowohl vorgibt, wie defuddle aufgerufen werden soll, als auch, was mit dem bereinigten Inhalt anschließend passieren soll.

Empfohlener Workflow und was du zuerst lesen solltest

Dieser Skill ist bewusst klein gehalten. Lies zuerst skills/defuddle/SKILL.md, denn dort steht der komplette nutzbare Workflow: Installation, Parse-Befehl, Ausgabeformate und Metadaten-Eigenschaften. In der Praxis ist diese Reihenfolge sinnvoll:

Prüfen, ob die URL eine normale HTML-Seite oder eine .md-Datei ist.
defuddle parse <url> --md ausführen.
Wenn du ein wiederverwendbares Artefakt brauchst, -o content.md ergänzen.
Wenn du nur Routing oder Validierung brauchst, Metadaten mit -p abfragen.
Das bereinigte Markdown in Zusammenfassung, Extraktion oder Notizerfassung weitergeben.

FAQ zum defuddle skill

Ist defuddle besser als ein normaler Prompt plus Fetch?

Für artikelartige Seiten meistens ja. Ein normaler Fetch enthält oft Header, Footer, Cookie-Hinweise und Navigation. defuddle usage verbessert das Signal-Rausch-Verhältnis schon vor Beginn der Analyse, was Token-Kosten senken und Zusammenfassungsfehler durch irrelevante Seitenelemente reduzieren kann.

Wann sollte ich den defuddle skill nicht verwenden?

Überspringe defuddle bei .md-URLs, Rohdateien oder wenn du exaktes HTML, Verhalten eingebetteter Medien, Seitenskripte oder Layout-Details brauchst. Es ist ein Tool zur Inhalts-Extraktion, kein Werkzeug für Browser-Automation oder DOM-Inspektion.

Ist der defuddle skill einsteigerfreundlich?

Ja. Die Befehlsoberfläche ist sehr klein: einmal installieren, dann defuddle parse <url> --md verwenden. Dadurch lässt sich der defuddle skill auch dann leicht übernehmen, wenn du nur saubereren Quelltext für Research oder Notizen möchtest.

Welche Ausgaben kann defuddle zurückgeben?

Du kannst Markdown mit --md, JSON mit --json, standardmäßig HTML oder gezielte Metadaten mit -p <name> erhalten. Für die meisten Lese- und Research-Aufgaben ist Markdown die beste Standardeinstellung; der Metadaten-Modus eignet sich gut für schnelle Validierung und Weiterleitung.

So verbesserst du den defuddle skill

Dem defuddle skill ein präzises Seitenziel geben

Der einfachste Weg, defuddle bessere Ergebnisse zu entlocken, ist eine kanonische Inhaltsseite anzugeben – nicht die Startseite, eine Suchseite oder eine Übersichtsseite. Artikel-URLs und einzelne Doku-Seiten liefern saubereres Markdown als Hubs voller Navigation und wiederholter Links.

Die nachgelagerte Aufgabe direkt in derselben Anfrage nennen

Der defuddle skill ist stärker, wenn die Extraktion direkt mit einem konkreten nächsten Schritt verknüpft ist. Statt nur „parse this“ zu sagen, frage nach:

Zusammenfassung
Kernaussagen
Setup-Schritten
FAQs
Zitaten
Vergleichspunkten

Das reduziert Unklarheiten bei der Übergabe und hilft dem Agenten, die Ausgabe an deiner eigentlichen Aufgabe auszurichten.

Bei Unsicherheit erst den Metadaten-Modus nutzen, dann vollständig extrahieren

Wenn die URL weiterleiten könnte, qualitativ fraglich ist oder womöglich die falsche Seite trifft, starte mit:

defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain

Das ist eine einfache, aber wirksame defuddle guide-Taktik: erst Relevanz prüfen, dann Aufwand in die vollständige Markdown-Extraktion investieren.

Typische Fehlerbilder und wie du sinnvoll iterierst

Wenn die Ausgabe zu dünn wirkt oder seltsam strukturiert ist, liegt das Problem oft an der Quellseite, nicht an der CLI. Probiere eine spezifischere URL, wechsle von einer Kategorieseite zu einer Artikelseite oder speichere das Markdown, um es manuell zu prüfen. Wenn dein erstes Ergebnis zu breit ist, führe defuddle für Web Research noch einmal mit engerer Anweisung aus, etwa „extract setup steps only“ oder „quote sections about authentication only“.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

use-my-browser

von xixu-me

use-my-browser ist ein Skill für Browser-Automatisierungsstrategien, mit dem sich die passende Web-Ebene wählen lässt: öffentliche Web-Tools, live Chrome, raw fetch oder Playwright für angemeldete, dynamische und DevTools-gesteuerte Aufgaben.

Browser Automation

Favoriten 0GitHub 6

web-access

von eze-is

web-access ist ein Skill für die Arbeit im Live-Web und kombiniert Suche, Seitenabruf, Roh-HTML-Inspektion sowie Chrome-CDP-Browserautomatisierung für dynamische, login-geschützte und interaktive Websites.

Browser Automation

Favoriten 0GitHub 2.6k

perplexity

von softaworks

perplexity ist ein fokussiertes Skill für Perplexity-gestützte Webrecherche in softaworks/agent-toolkit. Es hilft bei der Wahl zwischen Search, Ask und `/research`, empfiehlt einen Start mit niedrigen Ergebnislimits und rät davon ab, Websuche für Doku, Workspace-Fragen oder bereits bekannte URLs zu verwenden.

Web Research

Favoriten 0GitHub 1.3k

producthunt

von ReScienceLab

producthunt ist eine Product Hunt Skill zum Abrufen von Posts, Topics, Nutzern, Collections und Kommentaren über die offizielle GraphQL API. Installiere sie aus ReScienceLab/opc-skills, setze `PRODUCTHUNT_ACCESS_TOKEN` und führe Skripte wie `get_posts.py` und `get_post.py` für Launch-Recherche und das Monitoring von Product Launches aus.

Product Launches

Favoriten 0GitHub 654

firecrawl

von firecrawl

firecrawl Skill zum Installieren, Authentifizieren und Nutzen der offiziellen Firecrawl CLI für Web-Scraping, Suche, Crawling und Seiteninteraktion. Erfahren Sie, wie Einrichtung, `firecrawl --status`, Login, sichere Dateiausgabe nach `.firecrawl/` und praxisnahe Nutzungsmuster laut Repository funktionieren.

Web Scraping

Favoriten 0GitHub 234

firecrawl-search

von firecrawl

firecrawl-search ist eine Skill für Webrecherche, um Quellen zu finden, strukturierte Suchen auszuführen und optional vollständige Seiteninhalte mit Firecrawl CLI als JSON zu extrahieren.

Web Research

Favoriten 0GitHub 234

tavily-search

von tavily-ai

tavily-search ist eine Web-Recherche-Skill, die die Tavily CLI nutzt, um strukturierte Suchergebnisse für AI-Agenten zurückzugeben, einschließlich Snippets, Relevanzsignalen und Metadaten. Unterstützt werden Domain-Filter, Zeiträume und eine erweiterte Suchtiefe für die aktuelle Quellenrecherche und geführte Web-Recherche-Workflows.

Web Research

Favoriten 0GitHub 184

requesthunt

von ReScienceLab

requesthunt hilft dir, echtes Nutzerfeedback von Reddit, X und GitHub für Demand-Research und Wettbewerbsanalysen zu sammeln und auszuwerten. Lege einen `REQUESTHUNT_API_KEY` fest, führe die Python-Skripte aus, scrape Themen, suche Requests und verwandle Pain Points, Beschwerden und Feature-Requests in belastbare, beleggestützte Reports.

Competitive Analysis

Favoriten 0GitHub 0

firecrawl-agent

von firecrawl

firecrawl-agent unterstützt bei der Extraktion von strukturiertem JSON aus komplexen Websites mit mehreren Seiten. Hier erfahren Sie, wann sich das Tool eignet, wie Sie den Firecrawl CLI-Agent ausführen, Schemas hinzufügen, Start-URLs festlegen und Ausgaben für Preise, Produkte und verzeichnisartige Datenextraktion speichern.

Web Scraping

Favoriten 0GitHub 234

firecrawl-map

von firecrawl

firecrawl-map hilft Agents dabei, URLs auf einer Website zu finden und aufzulisten – mit Optionen für Suchfilter, Limits, JSON-Ausgabe, Sitemap-Modi und die Steuerung von Subdomains, bevor tieferes Scraping oder Crawling startet.

Web Scraping

Favoriten 0GitHub 234

domain-hunter

von ReScienceLab

domain-hunter unterstützt Agents dabei, verfügbare Domains zu finden, die Verfügbarkeit zu prüfen, Preise von Registraren zu vergleichen, TLD-Abwägungen zu bewerten und fundierter zu entscheiden, wo sie kaufen.

Web Research

Favoriten 0GitHub 0

fact-checker

von Shubhamsaboo

fact-checker ist ein promptgesteuerter Skill für strukturierte Faktenprüfung, Quellenbewertung und klare Urteile mit Vertrauensgrad und Kontext. Installiere ihn aus Shubhamsaboo/awesome-llm-apps, um Aussagen, Gerüchte, Statistiken und irreführende Behauptungen mit einem wiederholbaren Workflow zu prüfen.

Fact Checking

Favoriten 0GitHub 104.2k

deep-research

von Shubhamsaboo

deep-research ist ein leichtgewichtiger Agent-Skill für strukturierte Webrecherche. Er hilft dabei, den Umfang zu klären, mehrere Quellen zusammenzutragen, ihre Glaubwürdigkeit zu bewerten und belegte Erkenntnisse aus einem einzigen `SKILL.md`-Workflow zu verdichten.

Web Research

Favoriten 0GitHub 104.2k

research

von MarsWang42

Strukturierter Deep-Research-Workflow für komplexe Themen. Erfahren Sie, wie die research Skill funktioniert, was sie benötigt und wie Sie ihren Planungs- und Ausführungsablauf effektiv nutzen.

Academic Research

Favoriten 0GitHub 690

firecrawl-scrape

von firecrawl

firecrawl-scrape hilft dabei, saubere, LLM-taugliche Inhalte aus bekannten URLs zu extrahieren, auch von JS-gerenderten Seiten. Verwende es, um Markdown, Links oder seitenspezifische Antworten mit Firecrawl CLI oder `npx firecrawl` auszulesen.

Web Scraping

Favoriten 0GitHub 234

multi-search-engine

von openclaw

multi-search-engine ist eine Skill für Web-Recherche mit 17 Suchmaschinen, erweiterten Operatoren, Zeitfiltern, datenschutzorientierten Optionen und WolframAlpha-Abfragen. Sie hilft Agents, bessere Such-URLs ohne API-Keys zu erstellen und auszuführen.

Web Research

Favoriten 0GitHub 3.8k