firecrawl

von firecrawl

firecrawl Skill zum Installieren, Authentifizieren und Nutzen der offiziellen Firecrawl CLI für Web-Scraping, Suche, Crawling und Seiteninteraktion. Erfahren Sie, wie Einrichtung, `firecrawl --status`, Login, sichere Dateiausgabe nach `.firecrawl/` und praxisnahe Nutzungsmuster laut Repository funktionieren.

Stars234

Favoriten0

Kommentare0

Hinzugefügt31. März 2026

KategorieWeb Scraping

Installationsbefehl

npx skills add firecrawl/cli --skill firecrawl

Kurationswert

Dieser Skill erreicht 78/100 und ist damit ein überzeugender Verzeichniseintrag für Nutzer, die eine agentenauslösbare CLI für Web-Scraping und Suche mit klaren Installations- und Sicherheitshinweisen suchen. Das Repository zeigt starke Trigger-Signale, konkrete Prüfungen der Voraussetzungen und einen praxisnahen Umgang mit Sicherheit, auch wenn für vollständige Befehlsdetails weiterhin `--help` nötig ist.

78/100

Stärken

Sehr gut auslösbar: Die SKILL.md beschreibt ausdrücklich, wann der Skill verwendet werden soll (Suche, Scraping, Dokumentations-Crawling, URLs abrufen, mit Seiten interagieren) und wann nicht.
Die operativen Grundlagen sind klar: Er definiert erlaubte Bash-Aufrufe, verlangt `firecrawl --status` und enthält Installations- sowie Authentifizierungsschritte in `rules/install.md`.
Vertrauen und Sicherheit sind überdurchschnittlich gut abgedeckt: `rules/security.md` gibt konkrete Hinweise zum Umgang mit nicht vertrauenswürdigen Webinhalten, zur Isolierung von Ausgaben, zum schrittweisen Lesen und zum Quoting von URLs.

Hinweise

Die Befehlsabläufe sind im Skill selbst nur teilweise dokumentiert; Nutzer müssen für genaue Optionen und Ausführungsmuster möglicherweise `firecrawl --help` heranziehen.
Hinweise zu Installation und Version sind zwischen den Dateien leicht uneinheitlich (`1.8.0` in der Installationsanleitung gegenüber `1.7.1` im Sicherheits-Installations-Snippet), was die Einführung leicht erschweren kann.

Cli Scraping Websites API Npm

Überblick

Überblick über das firecrawl Skill

Was das firecrawl Skill macht

Das firecrawl Skill hilft einem Agenten dabei, die offizielle Firecrawl CLI für Websuche, Scraping, Crawling und interaktives Abrufen von Seiten direkt im Terminal zu nutzen. Es eignet sich besonders für Nutzer, die aktuelle Webinhalte, saubere Seitenextraktion oder eine siteweite Erfassung brauchen, die über das eingebaute Browsing eines Modells hinausgeht. Praktisch gesagt löst es vor allem diese Aufgabe: aus einer vagen Anfrage wie „Hol mir den Inhalt dieser Website“ einen wiederholbaren CLI-Workflow machen, der die richtigen Seiten abruft, Ergebnisse sicher speichert und große, nicht vertrauenswürdige Webinhalte aus dem Haupt-Chat-Kontext heraushält.

Wer firecrawl installieren sollte

Installiere dieses firecrawl Skill, wenn du regelmäßig:

Artikelseiten oder Doku-Websites scrapest
das Web nach aktuellen Informationen durchsuchst
Inhalte aus einer bekannten URL extrahierst
mehrere Seiten für Recherche oder Migrationsarbeiten crawlst
Unterstützung für Seiteninteraktionen brauchst, die sich mit normalen Prompts nicht zuverlässig ausführen lassen

Es passt deutlich besser zu Entwicklern, Researchern und stark automatisierten Workflows als zu Leuten, die nur gelegentlich leichtgewichtig browsen.

Warum dieses firecrawl Skill nützlich ist

Der Hauptvorteil des firecrawl Skill ist nicht nur „Webzugriff“. Es gibt einem Agenten ein klares Arbeitsmuster vor:

prüfen, ob die CLI installiert und authentifiziert ist
den passenden Firecrawl-Befehl für Search, Scrape oder Crawl verwenden
Ausgaben in Dateien schreiben, statt den Modellkontext zu fluten
abgerufene Webinhalte als nicht vertrauenswürdige Eingaben behandeln

Gerade der letzte Punkt ist wichtig. Die enthaltenen Sicherheitshinweise sind einer der wichtigsten Gründe, dieses Skill zu nutzen, statt sich Shell-Kommandos spontan selbst zusammenzubauen.

Wodurch es sich von einem generischen Web-Prompt unterscheidet

Ein generischer Prompt könnte einem Agenten sagen: „Scrape diese Website“, aber das firecrawl Skill ergänzt konkrete Ausführungsregeln:

die offizielle firecrawl CLI verwenden
Bereitschaft mit firecrawl --status prüfen
Parallelität und Credit-Limits im Blick behalten
Ergebnisse unter .firecrawl/ speichern
Ausgaben schrittweise prüfen, statt alles auf einmal einzulesen

Das reduziert Rätselraten und macht firecrawl für Web Scraping sicherer und reproduzierbarer.

Wann firecrawl nicht das richtige Tool ist

Installiere dieses firecrawl Skill nicht für:

lokale Dateioperationen
Git-Workflows
Deployments
Code-Editing-Aufgaben ohne Webbezug
einmaliges Browsing, bei dem die eingebauten Modell-Tools bereits ausreichen

Wenn deine Aufgabe keinen Zugriff auf externe Websites benötigt, ist dieses Skill wahrscheinlich überflüssig.

So verwendest du das firecrawl Skill

firecrawl installieren und Zugriff prüfen

Der schnellste firecrawl-Installationsweg laut Repository-Hinweisen ist:

npx -y firecrawl-cli -y

Dieser Ablauf installiert die CLI, startet die Authentifizierung und installiert die Skills. Eine manuelle Installation wird ebenfalls unterstützt:

npm install -g [email protected]

Anschließend die Umgebung prüfen:

firecrawl --status

Ein gesunder Status sollte Authentifizierung, Parallelität und verbleibende Credits anzeigen. Wenn firecrawl --status fehlschlägt, solltest du noch nicht mit dem Scraping beginnen.

Vor der ersten echten Nutzung authentifizieren

Der empfohlene Login-Weg ist Browser-Authentifizierung:

firecrawl login --browser

Falls nötig, kannst du dich auch mit einem API-Key authentifizieren:

firecrawl login --api-key "<key>"

Für viele Nutzer ist genau das die zentrale Hürde bei der Einführung: Das firecrawl Skill ist erst dann nützlich, wenn die Authentifizierung erfolgreich abgeschlossen ist. Wenn die Installation okay wirkt, Befehle aber trotzdem fehlschlagen, prüfe zuerst die Authentifizierung, bevor du die Befehlssyntax untersuchst.

Mit der richtigen Befehlsart starten

Bevor du Prompts schreibst, entscheide, welche Firecrawl-Aufgabe du tatsächlich brauchst:

search: Seiten zu einem Thema finden
scrape: Inhalte aus einer bestimmten URL extrahieren
crawl: Inhalte über eine ganze Website oder einen Doku-Bereich hinweg sammeln
interact/page actions: wenn die Zielseite Klicks oder loginähnliche Abläufe benötigt

Das Skill ist am wertvollsten, wenn der Agent unterscheiden kann zwischen „Quellen finden“, „diese bekannte Seite extrahieren“ und „diese gesamte Doku-Website erfassen“.

Welche Eingaben das firecrawl Skill braucht

Gute firecrawl-Nutzung beginnt mit vollständigen Aufgabendaten. Der Agent arbeitet besser, wenn du Folgendes angibst:

die genaue URL oder Domain
ob du eine Seite oder viele Seiten willst
welches Ausgabeformat du brauchst
welche Felder dich interessieren
was ignoriert werden soll, etwa Navigation, Boilerplate oder irrelevante Bereiche
ob Aktualität wichtig ist

Schwache Eingabe: „Hol Infos aus den Stripe-Dokus.“

Stärkere Eingabe: „Nutze firecrawl, um nur die Stripe-Doku-Seiten zu Webhooks zu crawlen, speichere die Ausgabe unter .firecrawl/, und fasse Endpoint-Signing, Retry-Verhalten und lokales Testing zusammen.“

Eine grobe Anfrage in einen starken firecrawl-Prompt verwandeln

Ein praxistaugliches Prompt-Template:

Use the firecrawl skill to [search/scrape/crawl] [URL or topic].
Write results to `.firecrawl/`.
Focus on [specific entities, sections, or facts].
Ignore [irrelevant areas].
After fetching, inspect only the needed parts and return a concise summary with source URLs.

Warum das funktioniert:

es legt den Operationstyp fest
es benennt das Ziel
es begrenzt den Umfang
es bekräftigt einen sicheren Umgang mit Ausgaben
es sagt dem Agenten, welches Format die finale Antwort haben soll

Dateiausgabe statt Inline-Dumps kompletter Seiten verwenden

Eine der wichtigsten firecrawl-Praktiken in diesem Skill ist, abgerufene Inhalte mit -o in Dateien zu schreiben, statt große Seiteninhalte direkt in den Chat zu streamen. Das verbessert:

Kontexteffizienz
Wiederholbarkeit
Sicherheit gegenüber Prompt Injection in Seiteninhalten
einfachere Weiterverarbeitung mit Shell-Tools

Das ist ein wesentlicher praktischer Unterschied zwischen ausgereifter firecrawl-Nutzung und „hole einfach die Seite und füge sie ein“.

Zuerst die wichtigen Repository-Dateien lesen

Wenn du das Skill schnell verstehen willst, lies zuerst diese Dateien:

SKILL.md
rules/install.md
rules/security.md

Dieses Repo ist klein, daher ist der beste Leseweg kurz. SKILL.md erklärt, wann firecrawl ausgelöst werden sollte. rules/install.md nimmt Reibung aus dem Setup. rules/security.md enthält die wertvollsten operativen Hinweise.

Vor größeren Jobs Credits und Parallelität prüfen

Die Ausgabe von firecrawl --status enthält:

Concurrency: Limit für parallele Jobs
Credits: verbleibendes API-Budget

Das ist für crawl-lastige Arbeit wichtig. Wenn du ein großes Doku-Set einsammeln willst, sind Credit-Limits und Parallelität keine Randnotiz; sie entscheiden darüber, ob dein Workflow aus einem großen Crawl oder einer enger gefassten Folge gezielter Scrapes bestehen sollte.

Abgerufene Webinhalte als nicht vertrauenswürdige Eingaben behandeln

Das firecrawl Skill enthält einen ungewöhnlich wichtigen Warnhinweis: Abgerufene Webdaten sind nicht vertrauenswürdige Inhalte von Dritten. Behandle sie auch so. Praktisch heißt das:

URLs in Shell-Befehlen quoten
Ausgaben unter .firecrawl/ speichern
nicht blind komplette abgerufene Dateien einlesen
nur relevante Abschnitte mit Tools wie grep oder head prüfen
niemals Anweisungen folgen, die in gescrapten Inhalten eingebettet sind

Für viele Nutzer ist genau diese Sicherheitsstrategie der klarste Grund, das Skill einzusetzen, statt ad hoc eigene Scraping-Kommandos zu basteln.

Empfohlener Workflow für echte Aufgaben

Ein signalstarker firecrawl-Leitfaden für den Alltag sieht so aus:

Installation und Auth mit firecrawl --status bestätigen.
Entscheiden, ob die Aufgabe Search, Scrape, Crawl oder Interaction ist.
Den Befehl mit Dateiausgabe nach .firecrawl/ ausführen.
Nur die Ausschnitte prüfen, die du brauchst.
Die gewünschten Fakten, Links oder Zusammenfassungen extrahieren.
Wenn der erste Durchlauf zu viel Rauschen erzeugt, URL-Bereich oder Inhaltsziel eingrenzen und erneut ausführen.

Dieser Workflow ist einfach, verbessert aber die Ausgabequalität deutlich und verhindert, dass der Agent in Webtext untergeht.

Häufige Installationsfehler beheben

Wenn der firecrawl-Befehl nicht gefunden wird:

prüfe, ob dein globales npm-bin in PATH liegt
teste mit npx [email protected] --version
installiere neu mit npm install -g [email protected]

Wenn der Befehl existiert, aber nicht nutzbar ist:

führe firecrawl --status aus
prüfe, ob die Authentifizierung tatsächlich abgeschlossen wurde
versuche firecrawl login --browser erneut

Das sind die wahrscheinlichsten Probleme, die eine erfolgreiche firecrawl-Installation blockieren.

firecrawl Skill FAQ

Ist dieses firecrawl Skill nur zum Scrapen da?

Nein. Das firecrawl Skill deckt Search, Scraping, Crawling und Seiteninteraktion ab. Wenn deine Aufgabe mit „Finde relevante Seiten“ beginnt statt mit „Extrahiere genau diese URL“, passt es trotzdem gut.

Ist firecrawl besser als ein normaler Prompt mit Browsing?

Meistens ja, wenn du wiederholbare Extraktion, Erfassung über mehrere Seiten, dateibasierte Ausgaben oder CLI-gesteuerte Workflows brauchst. Normale Prompts reichen für leichte Nachschlageaufgaben. Firecrawl ist besser, wenn du strukturiertes Web-Retrieval brauchst, das sich erneut ausführen oder lokal prüfen lässt.

Ist das firecrawl Skill anfängerfreundlich?

Mäßig. Der Installationsablauf ist unkompliziert, aber Einsteiger können an der Authentifizierung, CLI-Pfadproblemen oder der Unsicherheit hängen bleiben, ob sie suchen, scrapen oder crawlen sollten. Das Skill wird deutlich einfacher, sobald du in konkreten URLs und klar abgegrenzten Zielen denkst.

Brauche ich für firecrawl einen API-Key?

Nicht zwingend manuell, aber Authentifizierung brauchst du auf jeden Fall. Der empfohlene Weg ist firecrawl login --browser. Login per API-Key ist möglich, wenn Browser-Auth unpraktisch ist.

Wann sollte ich das firecrawl Skill nicht verwenden?

Lass es weg, wenn:

die Aufgabe keinen Webbezug hat
eingebautes Browsing ausreicht
du nur einen winzigen Ausschnitt von einer öffentlichen Seite brauchst und Wiederverwendung keine Rolle spielt
die Zielinhalte nicht über einen externen Scraping-Service abgerufen werden sollten

Was ist das Hauptrisiko bei firecrawl für Web Scraping?

Das größte praktische Risiko ist, gescrapte Inhalte als vertrauenswürdig zu behandeln. Webseiten können Prompt Injection enthalten oder das Modell schlicht mit irrelevantem Text überladen. Das Skill begegnet dem mit Empfehlungen für Dateiausgabe, schrittweises Lesen und selektive Extraktion.

So verbesserst du das firecrawl Skill

Dem firecrawl Skill engere Ziele geben

Der schnellste Weg zu besseren firecrawl-Ergebnissen ist weniger Mehrdeutigkeit. Bessere Eingaben spezifizieren:

genaue URL oder Domain
Grenzen der Seitenauswahl
gewünschte Fakten oder Entitäten
Ausschlussregeln
Format des finalen Ergebnisses

„Crawl diese Doku-Website“ ist breit. „Crawl nur die Abschnitte zu Authentifizierung und Rate Limits und vergleiche dann die Setup-Schritte“ liefert deutlich bessere Ergebnisse.

Nach Extraktionszielen fragen, nicht nur nach Abruf

Das firecrawl Skill funktioniert besser, wenn der Abruf an ein Entscheidungs- oder Auswertungsziel gekoppelt ist. Zum Beispiel:

„Finde die aktuelle Pricing-Seite und extrahiere die Plan-Limits“
„Scrape diese Changelog-Seite und fasse die Breaking Changes seit Januar zusammen“
„Crawl diese Doku-Seiten und liste alle Regeln für Webhook-Retries auf“

Dadurch lässt sich die abgerufene Ausgabe leichter filtern und ist schon nach dem ersten Durchlauf nützlicher.

Ausgabequalität mit gestuften Durchläufen verbessern

Bei größeren Jobs solltest du nicht mit dem breitesten Crawl beginnen. Ein besseres Muster ist:

einige repräsentative Seiten suchen oder scrapen
prüfen, wie die Inhalte tatsächlich aussehen
Umfang und Felder verfeinern
den größeren Crawl erst starten, wenn das Ziel klar ist

Das spart Credits und reduziert verrauschte Ergebnisse.

Die häufigsten Fehlerbilder vermeiden

Häufige firecrawl-Fehlermuster sind:

Crawl verwenden, obwohl ein einzelnes Scrape reichen würde
zu viel Boilerplate-Inhalt einsammeln
Auth-Prüfungen vergessen
massive Ausgabedateien in den Kontext einlesen
Credit-Limits nicht berücksichtigen
ein Thema statt einer URL angeben, obwohl exakte Extraktion nötig ist

Die meisten davon sind Probleme der Eingabequalität, nicht der Toolqualität.

Mit stärkeren Prompts zu besserer firecrawl-Nutzung

Ein stärkerer Prompt enthält normalerweise all das:

Operationstyp
Ziel-URL oder Thema
Umfangsgrenzen
erforderliche Felder
Ausgabeort
Analyseauftrag nach dem Abruf

Beispiel:

Use the firecrawl skill to scrape `https://example.com/docs/api/auth`.
Save output to `.firecrawl/`.
Extract only authentication methods, required headers, token expiry details, and example request patterns.
Then summarize the findings in bullets and cite the source URL.

Das ist deutlich besser als „Hol diese Doku-Seite“.

Nach dem ersten Durchlauf iterieren

Wenn das erste firecrawl-Ergebnis nicht nützlich ist, verbessere immer nur eine Variable auf einmal:

den URL-Satz eingrenzen
von Crawl auf Scrape wechseln
die genauen relevanten Abschnitte benennen
die Extraktion benannter Felder verlangen
das Format der finalen Antwort ändern

Kleine Prompt-Verfeinerungen bringen meist mehr als zusätzliche generische Anweisungen.

Das Sicherheitsmuster beibehalten

„Verbessere“ die firecrawl-Nutzung nicht, indem du vollständige rohe Seiten in den Chat kopierst. Der bessere Weg ist:

Ausgabe nach .firecrawl/
Teilinhalte prüfen
nur das Relevante extrahieren
außerhalb des Roh-Dumps zusammenfassen

So bleibt der wichtigste operative Vorteil des Skills erhalten: praktischer, sicherer Web-Abruf mit weniger Kontextverschwendung.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

huggingface-datasets

von huggingface

Nutze die Skill "huggingface-datasets" für Workflows mit der Hugging Face Dataset Viewer API, um Datensätze zu validieren, Splits aufzulösen, Zeilen vorzuschauen und zu paginieren, Text zu durchsuchen, Filter anzuwenden sowie Parquet-Links oder Statistiken abzurufen. Ein praktischer huggingface-datasets Leitfaden für die schreibgeschützte Erkundung von Datensätzen.

Web Scraping

Favoriten 0GitHub 10.4k

data-scraper-agent

von affaan-m

data-scraper-agent hilft beim Aufbau einer wiederholbaren Public-Data-Pipeline für Web Scraping, Anreicherung und Speicherung. Es ist für das Monitoring von Jobs, Preisen, News, Repos, Sport und Listings nach Zeitplan mit GitHub Actions ausgelegt, mit Ausgaben nach Notion, Sheets oder Supabase. Am besten für laufendes Tracking, nicht für einmalige Extraktionen.

Web Scraping

Favoriten 0GitHub 156.1k

baoyu-url-to-markdown

von JimLiu

baoyu-url-to-markdown wandelt Live-URLs mit einer eingebundenen baoyu-fetch-CLI per Chrome CDP, Site-Adaptern und generischem Fallback in Markdown um. Prüfen Sie die Bun-Laufzeitvoraussetzungen, die einmalige Einrichtung von EXTEND.md und die Nutzung für X, YouTube, Hacker News sowie gerenderte Seiten.

Format Conversion

Favoriten 0GitHub 13.2k

x-twitter-scraper

von Xquik-dev

Verwende x-twitter-scraper, um X-(Twitter-)Daten und bestätigungspflichtige Aktionen über Xquik abzurufen. Unterstützt sind Tweet-Suche, Nutzerabfragen, Follower-Extraktion, Medien-Downloads, Monitore, Webhooks, MCP und Schreibaktionen. Am besten geeignet für Web-Scraping-artige Recherchen mit API-Schlüssel, nicht mit X-Login-Daten.

Web Scraping

Favoriten 0GitHub 71

exa-search

von K-Dense-AI

exa-search ist eine Web-Recherche-Skill auf Basis von Exa für das Finden aktueller Informationen und das Extrahieren von Inhalten aus URLs. Sie eignet sich für Suche, Quellenrecherche, Artikel- und PDF-Extraktion sowie technische oder wissenschaftliche Recherchen mit semantischer Suche, akademischer Filterung und klaren Hinweisen zu Installation und Nutzung.

Web Research

Favoriten 0GitHub 0

browser-use

von browser-use

browser-use ist ein Skill für Browser-Automatisierung: Seiten öffnen, Status prüfen, indizierte Elemente anklicken, in Felder tippen, Screenshots erstellen und eine persistente Browser-Sitzung weiterverwenden. Geeignet für zuverlässiges Ausfüllen von Formularen, Navigation und eingeloggte Workflows mit der browser-use CLI.

Browser Automation

Favoriten 0GitHub 84.9k

remote-browser

von browser-use

remote-browser unterstützt sandboxed Agents dabei, einen Headless-Browser für Browser-Automatisierung zu steuern. Damit lassen sich Seiten öffnen, Zustände prüfen, indexierte Elemente anklicken, Eingaben tippen, Screenshots erstellen und Verbindungen zu lokalen Apps oder CDP-basierten Browser-Sitzungen herstellen.

Browser Automation

Favoriten 0GitHub 84.9k

firecrawl-search

von firecrawl

firecrawl-search ist eine Skill für Webrecherche, um Quellen zu finden, strukturierte Suchen auszuführen und optional vollständige Seiteninhalte mit Firecrawl CLI als JSON zu extrahieren.

Web Research

Favoriten 0GitHub 234

parallel-web

von K-Dense-AI

parallel-web ist ein Skill für Web-Recherche und Extraktion, der auf parallel-cli basiert. Er hilft dir beim Web-Suchen, beim Extrahieren von URL-Inhalten, beim Anreichern von Daten aus Quellen und bei tiefergehender Recherche, wobei wissenschaftliche und akademische Quellen priorisiert werden. Verwende ihn für die Nutzung von parallel-web, Web-Recherche, Zitate und evidenzbasierte Workflows.

Web Research

Favoriten 0GitHub 0

geomaster

von K-Dense-AI

geomaster ist eine Geowissenschafts-Skill für GIS, Fernerkundung, räumliche Analyse und Earth-Observation-Workflows. Nutzen Sie sie für Data-Analysis-Aufgaben wie Raster- und Vektoroperationen, die Verarbeitung von Satellitenbildern, räumliche Kennzahlen und die Planung von Workflows. Der geomaster-Guide hilft Ihnen, die Skill zu installieren, zu prüfen und mit weniger Rätselraten einzusetzen.

Data Analysis

Favoriten 0GitHub 0

asc-aso-audit

von rudrankriyam

asc-aso-audit hilft dir, ein Offline-ASO-Audit für kanonische App-Store-Metadaten in `./metadata` durchzuführen und anschließend mit Astro MCP Keyword-Lücken aufzudecken. Verwende die asc-aso-audit Skill nach `asc metadata pull`, um `subtitle`, `keywords`, `description` und `whatsNew` mit weniger Rätselraten zu prüfen.

Data Analysis

Favoriten 0GitHub 0

ffuf-web-fuzzing

von jthack

ffuf-web-fuzzing ist ein praxisnaher Skill zum Aufspüren versteckter Webinhalte, zum Testen von Routen und Parametern sowie zum Fuzzing authentifizierter Ziele mit Raw Requests, Auto-Kalibrierung und Ergebnisanalyse. Er eignet sich für Security-Tester, die einen wiederholbaren ffuf-web-fuzzing-Leitfaden für Penetrationstests und Security-Audit-Workflows benötigen.

Security Audit

Favoriten 0GitHub 0

web-to-markdown

von softaworks

web-to-markdown ist ein Skill für Formatkonvertierung, der Live-Webseiten über das lokale `web2md`-CLI in sauberes Markdown umwandelt. Für JS-gerenderte Seiten, interaktive Abläufe und die Batch-Konvertierung von URLs nutzt er einen Browser der Chromium-Familie. Er wird nur ausgeführt, wenn er ausdrücklich namentlich aufgerufen wird.

Format Conversion

Favoriten 0GitHub 1.3k

firecrawl-agent

von firecrawl

firecrawl-agent unterstützt bei der Extraktion von strukturiertem JSON aus komplexen Websites mit mehreren Seiten. Hier erfahren Sie, wann sich das Tool eignet, wie Sie den Firecrawl CLI-Agent ausführen, Schemas hinzufügen, Start-URLs festlegen und Ausgaben für Preise, Produkte und verzeichnisartige Datenextraktion speichern.

Web Scraping

Favoriten 0GitHub 234

firecrawl-map

von firecrawl

firecrawl-map hilft Agents dabei, URLs auf einer Website zu finden und aufzulisten – mit Optionen für Suchfilter, Limits, JSON-Ausgabe, Sitemap-Modi und die Steuerung von Subdomains, bevor tieferes Scraping oder Crawling startet.

Web Scraping

Favoriten 0GitHub 234

firecrawl-crawl

von firecrawl

firecrawl-crawl unterstützt Agenten dabei, Inhalte einer Website oder eines Docs-Bereichs in großem Umfang zu extrahieren – mit Pfadfiltern, Tiefenlimits, Seitenobergrenzen, Wait-Modus und Prüfungen des Job-Status.

Web Scraping

Favoriten 0GitHub 234