firecrawl-map

von firecrawl

firecrawl-map hilft Agents dabei, URLs auf einer Website zu finden und aufzulisten – mit Optionen für Suchfilter, Limits, JSON-Ausgabe, Sitemap-Modi und die Steuerung von Subdomains, bevor tieferes Scraping oder Crawling startet.

Stars234

Favoriten0

Kommentare0

Hinzugefügt31. März 2026

KategorieWeb Scraping

Installationsbefehl

npx skills add firecrawl/cli --skill firecrawl-map

Kurationswert

Diese Skill-Bewertung liegt bei 76/100. Damit ist firecrawl-map ein solider Kandidat für einen Verzeichniseintrag: Agents erhalten klare Auslöser für den Einsatz, konkrete CLI-Beispiele und genügend abgedeckte Optionen, um den Skill mit deutlich weniger Rätselraten als bei einem generischen Prompt zu nutzen. Für Verzeichnisnutzer reicht das für eine fundierte Installationsentscheidung, auch wenn die Skill-Seite insgesamt eher schlank ist und nur wenig Hinweise zu Sonderfällen oder zum Setup bietet.

76/100

Stärken

Sehr gut auslösbar: Die Beschreibung nennt konkrete Nutzerabsichten wie „map the site“, „find the URL for“ und „list all pages“.
Operativ klar: Die Beispiele zeigen echte Befehle sowohl für gezielte Suchen als auch für die vollständige URL-Ermittlung, inklusive Ausgabedateien und JSON-Modus.
Nützlich als Teil eines größeren Workflows: map wird sinnvoll als Schritt in einem Muster wie search → scrape → map → crawl → interact eingeordnet.

Hinweise

Die Klarheit bei Installation und Einführung ist eingeschränkt, weil der Skill in `SKILL.md` weder einen Installationsbefehl noch Setup-Hinweise enthält.
Das unterstützende Material ist knapp: Es gibt keine Skripte, Referenzen, Ressourcen oder expliziten Hinweise zu Einschränkungen und Sonderfällen.

Firecrawl Cli Scraping Websites Workflow Json

Überblick

Überblick über die firecrawl-map-Skill

Was firecrawl-map macht

firecrawl-map ist eine fokussierte Skill zur URL-Erkennung auf einer Website. Sie eignet sich besonders, wenn du die Domain kennst, aber die genaue Seite nicht, oder wenn du vor dem Scraping, Crawling oder Extrahieren von Inhalten schnell einen Überblick über die Site-Struktur brauchst.

Für wen sich die firecrawl-map-Skill eignet

Die firecrawl-map-Skill passt am besten für alle, die Web-Recherche, Site-Discovery oder die Planung vor dem Scraping betreiben:

AI-Agents, die vor einer tieferen Extraktion erst die richtige Seite finden müssen
Entwickler, die Web-Scraping-Workflows aufbauen
Researcher, die die öffentlich sichtbare URL-Struktur einer Website prüfen
Operatoren, die schnell eine URL-Liste brauchen, ohne einen vollständigen Crawl zu starten

Der eigentliche Anwendungsfall

In der Praxis wollen Nutzer meist nicht „alle Seiten“ als Selbstzweck. Sie möchten Fragen beantworten wie:

„Wo ist auf dieser Website die Authentifizierungsdokumentation?“
„Welche Seiten gibt es unter dieser Domain, bevor ich scrape?“
„Gibt es einen sitemap-basierten Shortcut, um URLs schnell zu finden?“
„Sollte ich zuerst mappen oder direkt crawlen?“

Genau deshalb ist firecrawl-map for Web Scraping besonders als Discovery-Schritt nützlich, nicht als finaler Schritt zur Datenextraktion.

Warum sich Nutzer für firecrawl-map entscheiden

Der wichtigste Unterschied liegt in Tempo und kontrollierbarem Scope. Im Vergleich zu einem generischen Prompt wie „finde die Docs-Seite“ bietet die firecrawl-map-Skill einen reproduzierbaren CLI-Weg, um URLs aufzulisten, nach Suchbegriffen zu filtern und die Ausgabe für spätere Schritte zu exportieren.

Wichtige Stärken, die sich im Repository zeigen:

Direkte CLI-Nutzung mit firecrawl map
Optionale Filterung mit --search für große Websites
URL-Inventar als Text oder JSON
Unterstützung für die Auswahl der Sitemap-Strategie
Sinnvoll als Zwischenschritt zwischen Suche und tieferem Crawl-/Scrape-Workflow

Wofür sie nicht gedacht ist

firecrawl-map ist nicht das richtige Tool, wenn du Folgendes brauchst:

Vollständige Extraktion von Seiteninhalten
Interaktives Browsing
Detailliertes strukturiertes Scraping pro Seite
Umfangreiche Traversierungslogik jenseits der reinen URL-Erkennung

In solchen Fällen ist Mapping der Vorbereitungsschritt, nicht das Ziel.

So verwendest du die firecrawl-map-Skill

Installationskontext für die firecrawl-map-Skill

Diese Skill liegt im Repository firecrawl/cli unter skills/firecrawl-map. Sie ist für Umgebungen gedacht, in denen Folgendes ausgeführt werden kann:

firecrawl *
npx firecrawl *

Wenn dein Agent oder lokaler Workflow Bash-Befehle ausführen kann, reicht dieser firecrawl-map-Installationsweg in der Regel aus:

npx firecrawl map "<url>" --limit 100

Wenn du die Firecrawl CLI bereits global verfügbar hast, nutze:

firecrawl map "<url>" --limit 100

Diese Datei solltest du vor der Nutzung zuerst lesen

Starte mit:

skills/firecrawl-map/SKILL.md

Dieser Repository-Ausschnitt ist klein, es gibt also nicht viel zusätzliches Material zu prüfen. Das beschleunigt die Einführung, bedeutet aber auch: Du solltest in deinen Prompts Domain, Ziel und Ausgabeformat klar benennen.

Grundlegende Nutzungsmuster von firecrawl-map

Die Skill unterstützt zwei typische Nutzungsmodi.

Eine wahrscheinlich passende Seite nach Thema finden:

firecrawl map "https://example.com" --search "authentication" -o .firecrawl/filtered.txt

Ein breiteres URL-Inventar erzeugen:

firecrawl map "https://example.com" --limit 500 --json -o .firecrawl/urls.json

Das ist das Kernmuster für die firecrawl-map usage: Starte eng mit einer Suche, wenn du eine bestimmte Seite suchst, oder breit mit einer begrenzten URL-Liste, wenn du den nächsten Scraping-Schritt planst.

Welche Eingaben die Skill braucht

Um die firecrawl-map-Skill gut zu nutzen, solltest du diese Eingaben klar angeben:

Die Root-URL oder Domain
Ob du eine wahrscheinliche Seite oder viele URLs brauchst
Einen Suchbegriff, wenn du das Thema kennst
Das gewünschte Limit für zurückgegebene URLs
Das Ausgabeformat: Plain Text oder JSON
Ob Subdomains berücksichtigt werden sollen
Wie mit Sitemaps umgegangen werden soll

Schwache Eingabe:

„Finde die Docs auf dieser Website“

Starke Eingabe:

„Mappe https://docs.example.com, suche nach authentication, gib die am besten passenden URLs als JSON zurück und beziehe Subdomains nur ein, wenn die Haupt-Docs-Domain zu wenige Treffer liefert.“

Die stärkere Version reduziert Rätselraten und macht die passende Befehlswahl eindeutig.

So wird aus einer groben Anfrage ein starker Prompt

Ein guter firecrawl-map-Leitfaden für Prompting ist: Nenne fünf Dinge in einem Satz:

Site
Absicht
Scope
Filter
Ausgabe

Beispiel:

„Use firecrawl-map on https://example.com to list up to 200 public URLs, prefer sitemap discovery, skip unrelated subdomains, and save JSON output for later scraping.“

Beispiel für gezielte Discovery:

„Use firecrawl-map to find the page on https://example.com most related to pricing API limits, and write matching URLs to a text file.“

Bester Workflow: erst mappen, dann scrapen oder crawlen

Ein praxistauglicher Workflow sieht so aus:

Verwende firecrawl map mit --search, wenn du eine einzelne Seite finden willst.
Verwende firecrawl map mit --limit und --json, wenn du ein breiteres URL-Set brauchst.
Prüfe die zurückgegebenen URLs.
Wähle die relevantesten Seiten aus.
Gehe erst dann zu Scrape oder Crawl über, wenn du die Site-Struktur ausreichend verstanden hast.

Das spart Zeit und Kosten gegenüber blindem Scraping.

Optionen, die die Ausgabequalität spürbar verändern

Die wichtigsten Optionen sind:

--search <query>: ideal, um auf einer großen Site eine thematisch passende Seite zu finden
--limit <n>: verhindert übergroße Ergebnismengen
--json: erleichtert nachgelagerte Filterung und Automatisierung
--sitemap <include|skip|only>: wichtig, wenn die Sitemap-Abdeckung relevant ist
--include-subdomains: erweitert den Scope, kann aber Rauschen hinzufügen
-o, --output <path>: macht Ergebnisse in einer Pipeline wiederverwendbar

Wenn die Resultate zu noisy sind, solltest du zuerst Suchbegriff, Domain-Scope und Einbezug von Subdomains enger fassen.

Die passende Sitemap-Strategie wählen

Die Option --sitemap ist wichtiger, als viele Nutzer erwarten:

only: am schnellsten, wenn du der Sitemap der Website vertraust und eine sauberere Abdeckung willst
include: guter Standard, wenn du Sitemap-Hilfe nutzen willst, ohne vollständig davon abhängig zu sein
skip: sinnvoll, wenn Sitemap-Ergebnisse veraltet, unvollständig oder irreführend sind

Für Dokumentationsseiten liefern include oder only oft bessere firecrawl-map for Web Scraping-Ergebnisse als eine ungebremste Discovery.

Wann du Subdomains einbeziehen solltest

Nutze --include-subdomains nur dann, wenn der Zielinhalt außerhalb des Haupt-Hostnamens liegen könnte, zum Beispiel auf:

docs.example.com
developers.example.com
support.example.com

Aktiviere die Option bei Unternehmensseiten nicht standardmäßig, wenn du nicht wirklich breitere Abdeckung willst. Sonst kann deine URL-Liste schnell mit Marketing-, Support- oder App-Bereichen überflutet werden, die nichts mit deinem Ziel zu tun haben.

Praktische Beispiele, die Nutzer tatsächlich brauchen

Eine Login- oder Auth-Dokumentationsseite finden:

firecrawl map "https://docs.example.com" --search "authentication" -o .firecrawl/auth-pages.txt

Ein wiederverwendbares JSON-URL-Inventar erzeugen:

firecrawl map "https://example.com" --limit 300 --json -o .firecrawl/site-map.json

Für eine Docs-Site nur Sitemap-basierte Discovery bevorzugen:

firecrawl map "https://docs.example.com" --sitemap only --limit 500 --json

Den Scope auf Subdomains erweitern, wenn unklar ist, wo die Docs liegen:

firecrawl map "https://example.com" --search "API reference" --include-subdomains

Häufige Hürden bei der Einführung

Die häufigsten Probleme mit der firecrawl-map-Skill sind keine Installationsprobleme, sondern Qualitätsprobleme bei der Anfrage:

Start mit einer zu breiten Domain
--search vergessen, obwohl nur eine einzelne Seite gesucht wird
Zu viele URLs ohne Limit ziehen
Subdomains zu früh einbeziehen
map wie ein Tool zur Inhaltsextraktion behandeln

Wenn das erste Ergebnis unübersichtlich ist, grenze zuerst die Site enger ein und schärfe das Thema, bevor du das Tool wechselst.

firecrawl-map-Skill FAQ

Ist firecrawl-map besser als ein normaler Prompt?

Ja, wenn die Aufgabe URL-Discovery auf einer bekannten Website ist. Ein normaler Prompt kann wahrscheinliche Seiten erraten, aber firecrawl-map bietet einen konkreten, wiederholbaren Weg, URLs aus der Zieldomain aufzulisten und zu filtern.

Ist die firecrawl-map-Skill gut für Einsteiger?

Ja, weil die Befehlsoberfläche klein ist. Der einfachste Einstieg ist einer dieser beiden Befehle:

firecrawl map "https://example.com" --search "pricing"

firecrawl map "https://example.com" --limit 100 --json

Der häufigste Fehler von Einsteigern ist, die Extraktion von Seiteninhalten zu verlangen. Das liegt außerhalb des Kernzwecks der Skill.

Wann sollte ich firecrawl-map statt Crawling verwenden?

Verwende firecrawl-map zuerst, wenn du die Site-Struktur verstehen oder passende Kandidatenseiten finden musst. Nutze Crawling später, wenn du nach der Discovery breitere Traversierung oder Verarbeitung auf Seitenebene brauchst.

Wann sollte ich firecrawl-map nicht verwenden?

Überspringe es, wenn:

du die exakte URL bereits kennst
du Seitentext, Metadaten oder strukturierte Extraktion brauchst
du Browser-Interaktion statt einer URL-Liste benötigst
die Aufgabe nichts mit Site-Discovery zu tun hat

Funktioniert firecrawl-map gut für große Websites?

Ja, aber nur, wenn du den Scope kontrollierst. Nutze --search, --limit und die Sitemap-Strategie bewusst. Gerade bei großen Websites bringt die firecrawl-map usage den meisten Mehrwert — dort erzeugen aber auch zu offene Prompts das meiste Rauschen.

Welches Ausgabeformat sollte ich wählen?

Wähle Plain Text, wenn ein Mensch einfach schnell eine Seitenliste braucht. Wähle --json, wenn ein anderes Tool, ein Script oder ein nachgelagerter Schritt die Ergebnisse weiterverarbeiten soll.

So verbesserst du die firecrawl-map-Skill

Starte mit einem engeren Ziel, als du zunächst denkst

Der einfachste Weg zu besseren firecrawl-map-Ergebnissen ist, den Scope früh zu verkleinern. Wenn du weißt, dass der Inhalt wahrscheinlich in der Dokumentation liegt, nutze direkt den Docs-Hostnamen statt der Unternehmens-Homepage.

Besser:

https://docs.example.com

Schlechter:

https://example.com

Nutze Suchphrasen, die zur Seitenintention passen

Bei der firecrawl-map-Skill ist die Qualität der Suche wichtiger als die Menge an Keywords. Kurze, absichtsorientierte Phrasen schlagen meist überladene Anfragen.

Besser:

authentication
rate limits
API reference

Schlechter:

where can I find complete developer authentication API reference and login documentation

Die bessere Version ist für URL-Filterung leichter nutzbar und liefert in der Regel sauberere Treffer.

Wähle JSON, wenn die Ergebnisse in einen weiteren Schritt gehen

Wenn dein nächster Schritt Scrape, Filter, Klassifizierung oder Deduplizierung ist, nutze:

--json

Diese kleine Entscheidung macht den firecrawl-map-Leitfaden deutlich automationsfreundlicher und reduziert manuellen Bereinigungsaufwand.

Nutze map iterativ, nicht nur einmal

Ein starker Workflow ist:

Führe eine enge --search-Abfrage aus
Prüfe die wahrscheinlich passenden URLs
Starte ein zweites Mapping auf der besten Subdomain oder im passendsten Bereich
Erhöhe --limit nur bei Bedarf
Wechsle zu scrape/crawl, sobald die Discovery stabil genug ist

Das ist besser als ein einziger riesiger Lauf, weil das Signal-Rausch-Verhältnis hoch bleibt.

Achte auf typische Fehlermuster

Typische Fehlermuster bei firecrawl-map for Web Scraping:

Zu viele irrelevante URLs aus breiten Domains
Zielseiten fehlen, weil die Suchbegriffe zu vage sind
Unvollständige Inventare durch die falsche Sitemap-Strategie
Noisy Ergebnisse, weil Subdomains unnötig aktiviert wurden

Für jedes Problem gibt es eine einfache Korrektur: Site enger fassen, Query schärfen, Sitemap-Modus wechseln oder den Scope verkleinern.

Verbessere Prompts, indem du Erfolgskriterien angibst

Bitte nicht einfach nur um „alle URLs“. Sage stattdessen, woran Erfolg gemessen wird.

Beispiel:

„Use firecrawl-map to find pages related to authentication setup on https://docs.example.com. Return the most relevant URLs first, cap at 50, and save JSON output for follow-up scraping.“

Damit werden Tool-Wahl, Parameter und Abbruchpunkt deutlich klarer.

Halte einen einfachen Eskalationspfad bereit

Nutze diesen praktischen Entscheidungsweg:

Eine wahrscheinlich passende Seite nötig: map --search
Ein URL-Inventar nötig: map --limit --json
Seiteninhalt nötig: scrape nach map
Breitere Traversierung nötig: crawl nach map

So verbesserst du firecrawl-map-Ergebnisse am effektivsten, ohne deinen Workflow unnötig zu verkomplizieren.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

huggingface-datasets

von huggingface

Nutze die Skill "huggingface-datasets" für Workflows mit der Hugging Face Dataset Viewer API, um Datensätze zu validieren, Splits aufzulösen, Zeilen vorzuschauen und zu paginieren, Text zu durchsuchen, Filter anzuwenden sowie Parquet-Links oder Statistiken abzurufen. Ein praktischer huggingface-datasets Leitfaden für die schreibgeschützte Erkundung von Datensätzen.

Web Scraping

Favoriten 0GitHub 10.4k

data-scraper-agent

von affaan-m

data-scraper-agent hilft beim Aufbau einer wiederholbaren Public-Data-Pipeline für Web Scraping, Anreicherung und Speicherung. Es ist für das Monitoring von Jobs, Preisen, News, Repos, Sport und Listings nach Zeitplan mit GitHub Actions ausgelegt, mit Ausgaben nach Notion, Sheets oder Supabase. Am besten für laufendes Tracking, nicht für einmalige Extraktionen.

Web Scraping

Favoriten 0GitHub 156.1k

baoyu-url-to-markdown

von JimLiu

baoyu-url-to-markdown wandelt Live-URLs mit einer eingebundenen baoyu-fetch-CLI per Chrome CDP, Site-Adaptern und generischem Fallback in Markdown um. Prüfen Sie die Bun-Laufzeitvoraussetzungen, die einmalige Einrichtung von EXTEND.md und die Nutzung für X, YouTube, Hacker News sowie gerenderte Seiten.

Format Conversion

Favoriten 0GitHub 13.2k

x-twitter-scraper

von Xquik-dev

Verwende x-twitter-scraper, um X-(Twitter-)Daten und bestätigungspflichtige Aktionen über Xquik abzurufen. Unterstützt sind Tweet-Suche, Nutzerabfragen, Follower-Extraktion, Medien-Downloads, Monitore, Webhooks, MCP und Schreibaktionen. Am besten geeignet für Web-Scraping-artige Recherchen mit API-Schlüssel, nicht mit X-Login-Daten.

Web Scraping

Favoriten 0GitHub 71

exa-search

von K-Dense-AI

exa-search ist eine Web-Recherche-Skill auf Basis von Exa für das Finden aktueller Informationen und das Extrahieren von Inhalten aus URLs. Sie eignet sich für Suche, Quellenrecherche, Artikel- und PDF-Extraktion sowie technische oder wissenschaftliche Recherchen mit semantischer Suche, akademischer Filterung und klaren Hinweisen zu Installation und Nutzung.

Web Research

Favoriten 0GitHub 0

browser-use

von browser-use

browser-use ist ein Skill für Browser-Automatisierung: Seiten öffnen, Status prüfen, indizierte Elemente anklicken, in Felder tippen, Screenshots erstellen und eine persistente Browser-Sitzung weiterverwenden. Geeignet für zuverlässiges Ausfüllen von Formularen, Navigation und eingeloggte Workflows mit der browser-use CLI.

Browser Automation

Favoriten 0GitHub 84.9k

remote-browser

von browser-use

remote-browser unterstützt sandboxed Agents dabei, einen Headless-Browser für Browser-Automatisierung zu steuern. Damit lassen sich Seiten öffnen, Zustände prüfen, indexierte Elemente anklicken, Eingaben tippen, Screenshots erstellen und Verbindungen zu lokalen Apps oder CDP-basierten Browser-Sitzungen herstellen.

Browser Automation

Favoriten 0GitHub 84.9k

firecrawl

von firecrawl

firecrawl Skill zum Installieren, Authentifizieren und Nutzen der offiziellen Firecrawl CLI für Web-Scraping, Suche, Crawling und Seiteninteraktion. Erfahren Sie, wie Einrichtung, `firecrawl --status`, Login, sichere Dateiausgabe nach `.firecrawl/` und praxisnahe Nutzungsmuster laut Repository funktionieren.

Web Scraping

Favoriten 0GitHub 234

firecrawl-search

von firecrawl

firecrawl-search ist eine Skill für Webrecherche, um Quellen zu finden, strukturierte Suchen auszuführen und optional vollständige Seiteninhalte mit Firecrawl CLI als JSON zu extrahieren.

Web Research

Favoriten 0GitHub 234

parallel-web

von K-Dense-AI

parallel-web ist ein Skill für Web-Recherche und Extraktion, der auf parallel-cli basiert. Er hilft dir beim Web-Suchen, beim Extrahieren von URL-Inhalten, beim Anreichern von Daten aus Quellen und bei tiefergehender Recherche, wobei wissenschaftliche und akademische Quellen priorisiert werden. Verwende ihn für die Nutzung von parallel-web, Web-Recherche, Zitate und evidenzbasierte Workflows.

Web Research

Favoriten 0GitHub 0

geomaster

von K-Dense-AI

geomaster ist eine Geowissenschafts-Skill für GIS, Fernerkundung, räumliche Analyse und Earth-Observation-Workflows. Nutzen Sie sie für Data-Analysis-Aufgaben wie Raster- und Vektoroperationen, die Verarbeitung von Satellitenbildern, räumliche Kennzahlen und die Planung von Workflows. Der geomaster-Guide hilft Ihnen, die Skill zu installieren, zu prüfen und mit weniger Rätselraten einzusetzen.

Data Analysis

Favoriten 0GitHub 0

asc-aso-audit

von rudrankriyam

asc-aso-audit hilft dir, ein Offline-ASO-Audit für kanonische App-Store-Metadaten in `./metadata` durchzuführen und anschließend mit Astro MCP Keyword-Lücken aufzudecken. Verwende die asc-aso-audit Skill nach `asc metadata pull`, um `subtitle`, `keywords`, `description` und `whatsNew` mit weniger Rätselraten zu prüfen.

Data Analysis

Favoriten 0GitHub 0

ffuf-web-fuzzing

von jthack

ffuf-web-fuzzing ist ein praxisnaher Skill zum Aufspüren versteckter Webinhalte, zum Testen von Routen und Parametern sowie zum Fuzzing authentifizierter Ziele mit Raw Requests, Auto-Kalibrierung und Ergebnisanalyse. Er eignet sich für Security-Tester, die einen wiederholbaren ffuf-web-fuzzing-Leitfaden für Penetrationstests und Security-Audit-Workflows benötigen.

Security Audit

Favoriten 0GitHub 0

web-to-markdown

von softaworks

web-to-markdown ist ein Skill für Formatkonvertierung, der Live-Webseiten über das lokale `web2md`-CLI in sauberes Markdown umwandelt. Für JS-gerenderte Seiten, interaktive Abläufe und die Batch-Konvertierung von URLs nutzt er einen Browser der Chromium-Familie. Er wird nur ausgeführt, wenn er ausdrücklich namentlich aufgerufen wird.

Format Conversion

Favoriten 0GitHub 1.3k

firecrawl-agent

von firecrawl

firecrawl-agent unterstützt bei der Extraktion von strukturiertem JSON aus komplexen Websites mit mehreren Seiten. Hier erfahren Sie, wann sich das Tool eignet, wie Sie den Firecrawl CLI-Agent ausführen, Schemas hinzufügen, Start-URLs festlegen und Ausgaben für Preise, Produkte und verzeichnisartige Datenextraktion speichern.

Web Scraping

Favoriten 0GitHub 234

firecrawl-crawl

von firecrawl

firecrawl-crawl unterstützt Agenten dabei, Inhalte einer Website oder eines Docs-Bereichs in großem Umfang zu extrahieren – mit Pfadfiltern, Tiefenlimits, Seitenobergrenzen, Wait-Modus und Prüfungen des Job-Status.

Web Scraping

Favoriten 0GitHub 234