firecrawl-download

von firecrawl

firecrawl-download hilft dir dabei, eine Website oder einen Dokumentationsbereich als strukturierte lokale Dateien unter `.firecrawl/` zu speichern. Die Skill kombiniert Site-Mapping und Scraping, unterstützt Markdown, Links und Screenshots und eignet sich für Offline-Kopien von Doku, das Erfassen vieler Seiten auf einmal und praktische Web-Scraping-Workflows.

Stars234

Favoriten0

Kommentare0

Hinzugefügt31. März 2026

KategorieWeb Scraping

Installationsbefehl

npx skills add firecrawl/cli --skill firecrawl-download

Kurationswert

Diese Skill erreicht 73/100 und ist damit für Verzeichnisnutzer grundsätzlich geeignet: Der Auslöser ist klar und der Workflow ist real, aber für die tatsächliche Nutzung bleibt noch etwas Interpretationsspielraum, weil das Repository nur eine einzelne `SKILL.md` mit begrenzten operativen Details jenseits von Befehlsbeispielen bereitstellt.

73/100

Stärken

Hohe Auslösbarkeit: Die Beschreibung nennt konkrete Nutzungsabsichten wie „die Website herunterladen“, „Offline-Kopie“ und „die gesamte Doku herunterladen“.
Echter Mehrwert für Agenten: Site-Mapping und Scraping werden in einem einzigen Befehl kombiniert, dazu sind hilfreiche Optionen wie Formate, Screenshots, Include-Pfade und Limits dokumentiert.
Praxisnahe Beispiele: Die `SKILL.md` enthält Quickstart-Befehle und weist ausdrücklich darauf hin, dass sich mit `-y` Bestätigungsabfragen überspringen lassen.

Hinweise

Die operative Tiefe ist begrenzt: Es gibt keine Zusatzdateien, Referenzen, Installationsanweisungen oder Entscheidungsregeln für Fehlerbehandlung, Skalierungsgrenzen oder das Management der Ausgaben.
Die Skill ist ausdrücklich als experimentell gekennzeichnet, was das Vertrauens- und Stabilitätsrisiko für produktionsnahe Agenten-Workflows erhöht.

Firecrawl Cli Scraping Websites Offline Markdown

Überblick

Überblick über die firecrawl-download Skill

Was firecrawl-download macht

Die firecrawl-download Skill ist für eine ganz bestimmte Aufgabe gedacht: eine Website oder einen Dokumentationsbereich als sauber organisierte lokale Dateien herunterzuladen. Sie kombiniert zuerst die Seitenerkennung mit dem anschließenden Scraping und speichert dann jede Seite unter .firecrawl/ als markdown, Screenshot oder in mehreren Ausgabeformaten pro Seite.

Besonders nützlich ist das, wenn du eine Offline-Kopie von Docs, ein lokales Recherche-Korpus oder einen wiederholbaren Weg brauchst, viele Seiten gesammelt für spätere Analysen zu sichern. Im Vergleich zu einem generischen Scraping-Prompt bietet firecrawl-download einen klareren Weg für die Erfassung ganzer Websites, statt dass du den Crawl-Workflow selbst von Grund auf entwerfen musst.

Für wen sich diese firecrawl-download Skill eignet

Am besten passt sie für:

Entwickler, die Dokumentation lokal speichern möchten
Forschende, die Website-Inhalte zur Auswertung sammeln
Teams, die ein schlankes Content-Archiv aufbauen
Agents, die einen praktikablen „download this site“-Workflow mit weniger Rätselraten brauchen

Wenn dein eigentliches Ziel lautet: „Diese Website als nutzbare lokale Dateien speichern“, ist diese Skill die bessere Wahl als ein allgemeiner Web-Scraping-Prompt.

Worauf Nutzer vor der Installation achten

Die meisten Installationsentscheidungen für firecrawl-download hängen an vier Fragen:

Kann die Skill eine ganze Website oder einen Docs-Bereich verarbeiten und nicht nur eine einzelne Seite?
Speichert sie die Ausgabe in einer lokal brauchbaren Struktur?
Lässt sich der Scope filtern, damit nicht die falschen Seiten heruntergeladen werden?
Unterstützt sie mehrere Ausgabetypen wie markdown und Screenshots?

Nach dem Skill-Quelltext ist die Antwort auf alle vier Fragen: ja. Der wichtigste Vorbehalt ist, dass sie als experimental gekennzeichnet ist. Du solltest sie daher eher als komfortablen Workflow verstehen als als besonders robustes Archivsystem.

Wichtigstes Unterscheidungsmerkmal für Web-Scraping-Workflows

Das Besondere an firecrawl-download for Web Scraping ist nicht nur reine Scraping-Leistung. Entscheidend ist, dass der Befehl Folgendes bündelt:

zuerst Site-Mapping
danach Scraping
dateibasierte Ausgabe pro Seite
verschachtelte lokale Verzeichnisse
Wiederverwendung von Scrape-Optionen beim Download

Damit ist die Skill für „Docs herunterladen“-Anwendungsfälle installierenswerter als ein einfacher Scrape-Befehl, der nur Seiteninhalt zurückgibt.

So verwendest du die firecrawl-download Skill

Installationskontext für firecrawl-download

Die Repository-Hinweise zeigen, dass diese Skill in firecrawl/cli unter skills/firecrawl-download liegt. Ein praktikabler Installationsweg ist:

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

Nach dem Hinzufügen solltest du dir Folgendes ansehen:

skills/firecrawl-download/SKILL.md

Diese Skill hat nur minimale Zusatzdateien, daher ist SKILL.md die wichtigste Quelle.

Diese Datei zuerst lesen

Starte mit:

skills/firecrawl-download/SKILL.md

Diese Datei zeigt sehr schnell den tatsächlichen Umfang: firecrawl download ist ein experimenteller Komfortbefehl, der map und scrape kombiniert, Ergebnisse unter .firecrawl/ speichert und Scrape-Optionen auch während des Downloads unterstützt.

Grundlegende firecrawl-download Nutzung

Am schnellsten nutzt du die firecrawl-download skill, indem du sie auf einen Docs- oder Content-Root zeigst:

firecrawl download https://docs.example.com

Für unbeaufsichtigte Läufe empfiehlt die Skill ausdrücklich:

firecrawl download https://docs.example.com -y

Verwende -y immer dann, wenn du Bestätigungsabfragen in agentischen oder skriptgesteuerten Workflows überspringen willst.

Welche Eingaben die Skill für gute Ergebnisse braucht

Ein grober Prompt wie „download this site“ ist oft zu schwach. Bessere Eingaben enthalten:

die Root-URL
die Bereichsgrenzen, die du tatsächlich möchtest
die maximale Seitenanzahl
die benötigten Ausgabeformate
ob Screenshots wichtig sind
was ausgeschlossen werden soll

Eine stärkere Anweisung sieht zum Beispiel so aus:

„Use firecrawl-download to save https://docs.example.com locally as markdown with screenshots, include only /guides and /api, limit to 50 pages, and skip translated pages.”

Damit hat die Skill genug Informationen, um vor dem Scraping den richtigen Scope zu erfassen.

Welche Befehle in der Praxis am wichtigsten sind

Der Quelltext zeigt einige besonders wertvolle Muster:

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

Diese Beispiele sind wichtig, weil sie typische Hürden in der Praxis adressieren: zu viel Inhalt, die falschen Bereiche oder zu geringe Ausgabequalität.

Was lokal geschrieben wird

Die Skill speichert die Ausgabe in verschachtelten Verzeichnissen unter .firecrawl/. Wenn du mehrere Formate anforderst, kann jede Seite separate Dateien erzeugen, zum Beispiel:

index.md
links.txt
screenshot.png

Diese lokale Dateiorganisation ist einer der Hauptgründe, sich für firecrawl-download install statt für einen einmaligen Scrape-Prompt zu entscheiden.

Wie du aus einem groben Ziel einen brauchbaren Prompt machst

Wenn dein erster Gedanke ist:

„download this docs site“

formuliere stattdessen konkret:

Ziel-URL
gewünschte Bereichsfilter
Dateiformate
Screenshot ja/nein
Seitenlimit
eventuelle Ausschlüsse

Beispiel-Prompt für einen Agent:

„Use the firecrawl-download skill to download https://docs.example.com for offline use. Save as markdown plus screenshots, include only /getting-started,/api, cap at 30 pages, and use -y so the run is non-interactive.”

Das funktioniert besser, weil Unklarheiten bei Scope und Ausgabe wegfallen.

Empfohlener Workflow für zuverlässige Ergebnisse mit firecrawl-download

Ein praktikabler firecrawl-download guide-Workflow ist:

Beginne mit dem kleinsten sinnvollen Docs-Bereich.
Nutze --include-paths, bevor du die Seitenanzahl erhöhst.
Starte den ersten Durchlauf mit --limit.
Prüfe die Ausgabestruktur unter .firecrawl/.
Ergänze --screenshot oder mehrere Formate nur dann, wenn du sie wirklich brauchst.
Erweitere den Crawl erst, wenn das erste Sample korrekt aussieht.

So vermeidest du den typischen Fehler, zu früh zu viel herunterzuladen.

Wann du firecrawl-download statt eines normalen Scrape-Befehls verwenden solltest

Nutze firecrawl-download usage, wenn du Folgendes brauchst:

viele Seiten statt nur einer
lokale Dateien statt nur zurückgegebenen Text
eine offline durchsuchbare bzw. nutzbare Kopie
einen schnellen Docs-Snapshot zur Prüfung oder Referenz

Nutze einen normalen Scrape-Befehl, wenn du nur eine Seite oder eine stark angepasste Extraktionslogik brauchst. Der Wert von firecrawl-download liegt in der Workflow-Geschwindigkeit beim Sichern von Inhalten im Website-Maßstab.

Wichtige Einschränkungen und Trade-offs früh verstehen

Die wichtigsten praktischen Einschränkungen laut Skill-Quelle sind:

sie ist als experimentell markiert
sie ist als Komfortbefehl optimiert
die Ausgabequalität hängt weiterhin von der Struktur der Zielseite und deinen Scope-Filtern ab
breite Läufe ohne Limits können unübersichtlich oder überzogen werden

Die Skill passt daher sehr gut für kontrollierte Docs-Downloads, garantiert aber keine perfekte archivische Vollständigkeit.

firecrawl-download Skill FAQ

Ist firecrawl-download gut für Einsteiger?

Ja, besonders wenn deine Aufgabe einfach „Docs lokal speichern“ ist. Die Befehlsbeispiele sind unkompliziert, und der interaktive Wizard hilft zusätzlich. Einsteiger sollten trotzdem mit einem kleinen --limit und eng gesetzten --include-paths beginnen, damit die Downloads nicht unnötig groß werden.

Was ist der echte Unterschied zu einem generischen AI-Scraping-Prompt?

Ein generischer Prompt kann die Aufgabe beschreiben, aber firecrawl-download bringt das nützliche Muster schon mit: Website mappen, jede Seite scrapen und die Dateien in Verzeichnissen speichern. Das reduziert Einrichtungsaufwand und macht den Workflow besser wiederholbar.

Ist firecrawl-download nur für Dokumentationsseiten gedacht?

Nein, aber Dokumentation ist der klarste Einsatzfall. Am besten funktioniert die Skill auf Websites, deren Seitenstruktur und Pfade einigermaßen vorhersehbar sind. Stark dynamische oder schlecht abgegrenzte Websites brauchen möglicherweise mehr Filterung oder einen anderen Ansatz.

Kann firecrawl-download mehr als nur markdown speichern?

Ja. Der Skill-Quelltext zeigt ausdrücklich mehrere Formate pro Seite sowie optionale Screenshots. Das ist wichtig, wenn du sowohl gut lesbaren Text als auch unterstützende visuelle Erfassung brauchst.

Wann sollte ich firecrawl-download nicht verwenden?

Verzichte auf firecrawl-download, wenn du nur Folgendes brauchst:

eine einzelne Seite
ein benutzerdefiniertes Extraktionsschema
tiefgehende Nachbearbeitung schon während des Scrapings
eine vollständig robuste Archiv-Pipeline mit strengeren Garantien

In diesen Fällen passt ein enger gefasster Scrape-Befehl oder ein stärker angepasster Workflow oft besser.

So verbesserst du die firecrawl-download Skill

Gib firecrawl-download zuerst einen engeren Scope

Der einfachste Weg, die Ergebnisse von firecrawl-download zu verbessern, ist weniger Mehrdeutigkeit. Nutze:

--include-paths
--limit
eine klar definierte Docs-Root-URL

Ein begrenzter 20-Seiten-Lauf ist meist nützlicher als ein unkontrollierter Vollcrawl über die gesamte Website.

Wähle Ausgaben nach dem tatsächlichen Downstream-Zweck

Fordere nicht standardmäßig jedes Format an. Wähle Formate passend zum nächsten Schritt:

markdown für Lesen, Suche und LLM-Ingestion
links, wenn die Struktur wichtig ist
--screenshot, wenn Layout oder UI-Belege relevant sind

So bleiben die Läufe leichter und die Ausgaben einfacher zu prüfen.

Nutze einen Probelauf vor dem vollständigen Download

Ein starkes Iterationsmuster ist:

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

Prüfe die gespeicherten Dateien und erweitere erst dann auf mehr Bereiche oder höhere Limits. So erkennst du schlechte Scope-Entscheidungen frühzeitig.

Typische Fehlerbilder und wie du sie vermeidest

Häufige Probleme sind:

die falschen Bereiche werden heruntergeladen
es werden zu viele Seiten gesammelt
-y wird in automatisierten Läufen vergessen
es werden Ausgaben angefordert, die du gar nicht brauchst

Die Lösung ist einfach: Scope klar angeben, den ersten Lauf begrenzen und Ausgaben bewusst auswählen.

Prompt-Qualität für agentische firecrawl-download Nutzung verbessern

Wenn ein Agent die Skill aufruft, frage nach:

exakter Start-URL
gewünschtem Zweck der lokalen Ausgabe
einzuschließenden Bereichen
zu vermeidenden Bereichen
Ausgabeformaten
Run-Größenlimit

Guter Prompt:

„Use firecrawl-download to create an offline markdown copy of https://docs.example.com, only for /guides and /reference, with screenshots for each page, limited to 40 pages, and save non-interactively.”

Das führt zu einer besseren Ausführung als „download the docs“.

Wie du nach der ersten Ausgabe sinnvoll iterierst

Bewerte nach dem ersten Durchlauf:

Enthielt .firecrawl/ die Seiten, die du erwartet hast?
Waren zu viele irrelevante Seiten dabei?
Brauchtest du Screenshots oder nur Text?
Sollte der nächste Lauf die Include-Pfade erweitern oder enger fassen?

Der beste Weg, die firecrawl-download skill zu verbessern, ist nicht blind neu zu starten, sondern Scope und Ausgabeentscheidungen anhand der tatsächlich erzeugten ersten Ergebnisse anzupassen.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

huggingface-datasets

von huggingface

Nutze die Skill "huggingface-datasets" für Workflows mit der Hugging Face Dataset Viewer API, um Datensätze zu validieren, Splits aufzulösen, Zeilen vorzuschauen und zu paginieren, Text zu durchsuchen, Filter anzuwenden sowie Parquet-Links oder Statistiken abzurufen. Ein praktischer huggingface-datasets Leitfaden für die schreibgeschützte Erkundung von Datensätzen.

Web Scraping

Favoriten 0GitHub 10.4k

data-scraper-agent

von affaan-m

data-scraper-agent hilft beim Aufbau einer wiederholbaren Public-Data-Pipeline für Web Scraping, Anreicherung und Speicherung. Es ist für das Monitoring von Jobs, Preisen, News, Repos, Sport und Listings nach Zeitplan mit GitHub Actions ausgelegt, mit Ausgaben nach Notion, Sheets oder Supabase. Am besten für laufendes Tracking, nicht für einmalige Extraktionen.

Web Scraping

Favoriten 0GitHub 156.1k

baoyu-url-to-markdown

von JimLiu

baoyu-url-to-markdown wandelt Live-URLs mit einer eingebundenen baoyu-fetch-CLI per Chrome CDP, Site-Adaptern und generischem Fallback in Markdown um. Prüfen Sie die Bun-Laufzeitvoraussetzungen, die einmalige Einrichtung von EXTEND.md und die Nutzung für X, YouTube, Hacker News sowie gerenderte Seiten.

Format Conversion

Favoriten 0GitHub 13.2k

x-twitter-scraper

von Xquik-dev

Verwende x-twitter-scraper, um X-(Twitter-)Daten und bestätigungspflichtige Aktionen über Xquik abzurufen. Unterstützt sind Tweet-Suche, Nutzerabfragen, Follower-Extraktion, Medien-Downloads, Monitore, Webhooks, MCP und Schreibaktionen. Am besten geeignet für Web-Scraping-artige Recherchen mit API-Schlüssel, nicht mit X-Login-Daten.

Web Scraping

Favoriten 0GitHub 71

exa-search

von K-Dense-AI

exa-search ist eine Web-Recherche-Skill auf Basis von Exa für das Finden aktueller Informationen und das Extrahieren von Inhalten aus URLs. Sie eignet sich für Suche, Quellenrecherche, Artikel- und PDF-Extraktion sowie technische oder wissenschaftliche Recherchen mit semantischer Suche, akademischer Filterung und klaren Hinweisen zu Installation und Nutzung.

Web Research

Favoriten 0GitHub 0

browser-use

von browser-use

browser-use ist ein Skill für Browser-Automatisierung: Seiten öffnen, Status prüfen, indizierte Elemente anklicken, in Felder tippen, Screenshots erstellen und eine persistente Browser-Sitzung weiterverwenden. Geeignet für zuverlässiges Ausfüllen von Formularen, Navigation und eingeloggte Workflows mit der browser-use CLI.

Browser Automation

Favoriten 0GitHub 84.9k

remote-browser

von browser-use

remote-browser unterstützt sandboxed Agents dabei, einen Headless-Browser für Browser-Automatisierung zu steuern. Damit lassen sich Seiten öffnen, Zustände prüfen, indexierte Elemente anklicken, Eingaben tippen, Screenshots erstellen und Verbindungen zu lokalen Apps oder CDP-basierten Browser-Sitzungen herstellen.

Browser Automation

Favoriten 0GitHub 84.9k

firecrawl

von firecrawl

firecrawl Skill zum Installieren, Authentifizieren und Nutzen der offiziellen Firecrawl CLI für Web-Scraping, Suche, Crawling und Seiteninteraktion. Erfahren Sie, wie Einrichtung, `firecrawl --status`, Login, sichere Dateiausgabe nach `.firecrawl/` und praxisnahe Nutzungsmuster laut Repository funktionieren.

Web Scraping

Favoriten 0GitHub 234

firecrawl-search

von firecrawl

firecrawl-search ist eine Skill für Webrecherche, um Quellen zu finden, strukturierte Suchen auszuführen und optional vollständige Seiteninhalte mit Firecrawl CLI als JSON zu extrahieren.

Web Research

Favoriten 0GitHub 234

parallel-web

von K-Dense-AI

parallel-web ist ein Skill für Web-Recherche und Extraktion, der auf parallel-cli basiert. Er hilft dir beim Web-Suchen, beim Extrahieren von URL-Inhalten, beim Anreichern von Daten aus Quellen und bei tiefergehender Recherche, wobei wissenschaftliche und akademische Quellen priorisiert werden. Verwende ihn für die Nutzung von parallel-web, Web-Recherche, Zitate und evidenzbasierte Workflows.

Web Research

Favoriten 0GitHub 0

geomaster

von K-Dense-AI

geomaster ist eine Geowissenschafts-Skill für GIS, Fernerkundung, räumliche Analyse und Earth-Observation-Workflows. Nutzen Sie sie für Data-Analysis-Aufgaben wie Raster- und Vektoroperationen, die Verarbeitung von Satellitenbildern, räumliche Kennzahlen und die Planung von Workflows. Der geomaster-Guide hilft Ihnen, die Skill zu installieren, zu prüfen und mit weniger Rätselraten einzusetzen.

Data Analysis

Favoriten 0GitHub 0

asc-aso-audit

von rudrankriyam

asc-aso-audit hilft dir, ein Offline-ASO-Audit für kanonische App-Store-Metadaten in `./metadata` durchzuführen und anschließend mit Astro MCP Keyword-Lücken aufzudecken. Verwende die asc-aso-audit Skill nach `asc metadata pull`, um `subtitle`, `keywords`, `description` und `whatsNew` mit weniger Rätselraten zu prüfen.

Data Analysis

Favoriten 0GitHub 0

ffuf-web-fuzzing

von jthack

ffuf-web-fuzzing ist ein praxisnaher Skill zum Aufspüren versteckter Webinhalte, zum Testen von Routen und Parametern sowie zum Fuzzing authentifizierter Ziele mit Raw Requests, Auto-Kalibrierung und Ergebnisanalyse. Er eignet sich für Security-Tester, die einen wiederholbaren ffuf-web-fuzzing-Leitfaden für Penetrationstests und Security-Audit-Workflows benötigen.

Security Audit

Favoriten 0GitHub 0

web-to-markdown

von softaworks

web-to-markdown ist ein Skill für Formatkonvertierung, der Live-Webseiten über das lokale `web2md`-CLI in sauberes Markdown umwandelt. Für JS-gerenderte Seiten, interaktive Abläufe und die Batch-Konvertierung von URLs nutzt er einen Browser der Chromium-Familie. Er wird nur ausgeführt, wenn er ausdrücklich namentlich aufgerufen wird.

Format Conversion

Favoriten 0GitHub 1.3k

firecrawl-agent

von firecrawl

firecrawl-agent unterstützt bei der Extraktion von strukturiertem JSON aus komplexen Websites mit mehreren Seiten. Hier erfahren Sie, wann sich das Tool eignet, wie Sie den Firecrawl CLI-Agent ausführen, Schemas hinzufügen, Start-URLs festlegen und Ausgaben für Preise, Produkte und verzeichnisartige Datenextraktion speichern.

Web Scraping

Favoriten 0GitHub 234

firecrawl-map

von firecrawl

firecrawl-map hilft Agents dabei, URLs auf einer Website zu finden und aufzulisten – mit Optionen für Suchfilter, Limits, JSON-Ausgabe, Sitemap-Modi und die Steuerung von Subdomains, bevor tieferes Scraping oder Crawling startet.

Web Scraping

Favoriten 0GitHub 234