firecrawl-scrape

par firecrawl

firecrawl-scrape permet d’extraire un contenu propre et adapté aux LLM à partir d’URL connues, y compris sur des pages rendues en JS. Utilisez-le pour récupérer du markdown, des liens ou des réponses ciblées sur une page avec Firecrawl CLI ou `npx firecrawl`.

Étoiles234

Favoris0

Commentaires0

Ajouté31 mars 2026

CatégorieWeb Scraping

Commande d’installation

npx skills add firecrawl/cli --skill firecrawl-scrape

Score éditorial

Cette skill obtient la note de 72/100, ce qui la rend acceptable dans l’annuaire pour les utilisateurs qui cherchent une commande claire de scraping d’URL, sans pour autant constituer une page de décision d’installation particulièrement complète. Les éléments observés dans le dépôt montrent une bonne capacité de déclenchement et des exemples de commandes concrets pour extraire en markdown le contenu de pages statiques ou rendues en JS, avec prise en charge de plusieurs URL, de différents formats de sortie et de l’extraction par requête. En revanche, la clarté pour décider de l’adoption est freinée par une description de haut niveau très succincte, l’absence de commande d’installation dans `SKILL.md` et le manque de fichiers de support ou de consignes opérationnelles plus poussées.

72/100

Points forts

Les signaux de déclenchement sont solides dans la description, qui associe explicitement des intentions comme "scrape", "fetch" et "read this webpage" à cette skill.
Les exemples de prise en main montrent des usages concrets : scraping de base, extraction du contenu principal uniquement, attente du rendu JS, traitement de plusieurs URL, formats alternatifs et interrogation ciblée d’une page.
La valeur opérationnelle est bien plus précise qu’un simple prompt générique : il est indiqué aux agents d’utiliser `firecrawl scrape`/`npx firecrawl`, d’enregistrer les sorties et de privilégier cette option à WebFetch pour l’extraction de pages web.

Points de vigilance

`SKILL.md` ne contient pas de commande d’installation ; les utilisateurs ont donc encore besoin d’un contexte externe pour configurer la CLI avant de pouvoir l’exécuter.
Le support fourni par le dépôt reste limité au-delà d’un seul fichier markdown : il n’y a ni scripts, ni références, ni ressources complémentaires pour le dépannage, l’authentification/la configuration ou la gestion des cas limites.

Firecrawl Scraping Websites Markdown Cli Browser Automation

Vue d’ensemble

Vue d’ensemble de la compétence firecrawl-scrape

Ce que fait firecrawl-scrape

La compétence firecrawl-scrape sert à extraire un contenu propre et exploitable par un LLM à partir d’une ou plusieurs pages web lorsque vous connaissez déjà l’URL. Elle est conçue pour la récupération pratique de pages, pas pour l’exploration large d’un site : vous lui donnez une page, et elle renvoie une sortie structurée comme du markdown, des liens ou une réponse directe à une requête fondée sur cette page.

À qui s’adresse firecrawl-scrape

Cette compétence convient aux utilisateurs qui ont besoin d’un contenu de page fiable depuis :

des pages de documentation
des articles de blog
des pages tarifaires
des pages produit
des sites rendus en JavaScript et des SPA

Elle est particulièrement utile si les outils de fetch classiques échouent sur des pages rendues côté client ou renvoient un HTML bruité difficile à transmettre à un LLM.

Le vrai besoin auquel firecrawl-scrape répond

La plupart des utilisateurs ne cherchent pas du « web scraping » au sens abstrait. Ils veulent plutôt l’un de ces résultats :

lire une page en markdown pour l’analyser ensuite
extraire le contenu principal sans les en-têtes ni les pieds de page
récupérer les liens en plus du texte de la page
poser une question ciblée sur une URL connue
scraper plusieurs URL connues en parallèle

C’est précisément là que firecrawl-scrape est plus solide qu’un prompt générique du type « lis cette page web ».

Pourquoi choisir firecrawl-scrape plutôt qu’un fetch générique

Le principal différenciateur est que firecrawl-scrape est pensé pour l’extraction de contenu de pages web, y compris sur des pages rendues en JS, avec une sortie optimisée pour les workflows LLM. La compétence source indique explicitement qu’il faut l’utiliser à la place de WebFetch pour l’extraction de contenu web. C’est important si votre navigateur habituel ou votre méthode de fetch manque le contenu rendu, récupère trop d’éléments de navigation, ou perd le contexte des liens.

D’un coup d’œil : quand firecrawl-scrape est adapté ou non

Bien adapté si :

vous avez déjà l’URL
vous voulez le contenu d’une page, pas explorer tout un site
vous avez besoin de markdown ou de liens dans un format exploitable par une machine
la page peut nécessiter un temps de rendu avant que le contenu n’apparaisse

Moins adapté si :

vous devez d’abord découvrir les URL
vous avez besoin d’un parcours sur l’ensemble du site
vous avez besoin d’interactions au-delà du scraping de page
un simple fetch HTML statique vous suffit et vous faites déjà confiance à un autre outil

Comment utiliser la compétence firecrawl-scrape

Contexte d’installation de firecrawl-scrape

Cette compétence se trouve dans le dépôt firecrawl/cli, sous skills/firecrawl-scrape. La compétence elle-même fournit des consignes d’utilisation pour la CLI Firecrawl ; en pratique, il vous faut donc un accès à la commande firecrawl ou à npx firecrawl. Les exemples de la compétence utilisent les deux formes :

firecrawl scrape ...
npx firecrawl ...

Si la CLI n’est pas déjà disponible dans votre environnement, utilisez la forme npx firecrawl pour limiter la friction d’installation.

Les entrées dont firecrawl-scrape a besoin

Au minimum, firecrawl-scrape a besoin d’une URL précise. Ensuite, la qualité de la sortie dépend de ce que vous précisez en plus :

le format de sortie souhaité : markdown, links, ou les deux
le fait de ne conserver que le contenu principal
le besoin éventuel d’un délai de rendu avec --wait-for
l’envie de sauvegarder le contenu brut de la page dans un fichier
l’envie d’obtenir une réponse ciblée avec --query

Ce n’est pas une compétence faite pour des demandes vagues comme « fais des recherches sur cette entreprise en ligne ». Elle est faite pour « scrape cette page précise et renvoie une sortie utile ».

La première commande la plus rapide qui fonctionne

Si vous avez simplement besoin d’un contenu de page lisible, commencez ici :

firecrawl scrape "<url>" -o .firecrawl/page.md

Si la page est encombrée par la navigation ou des barres latérales, utilisez :

firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

Si la page est une SPA ou charge son contenu après le rendu :

firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

Quand utiliser le mode contenu principal avec firecrawl-scrape

--only-main-content est l’une des options les plus utiles, car elle améliore souvent la qualité des étapes de synthèse et d’extraction en aval. Utilisez-la si votre objectif est :

résumer un article
extraire des détails produit ou tarifaires
injecter le contenu dans une autre étape LLM
réduire le gaspillage de tokens causé par les menus, pieds de page et éléments d’interface répétés

Évitez-la si vous avez explicitement besoin des liens de navigation ou du contexte de mise en page autour du contenu.

Comment gérer les pages rendues en JavaScript avec firecrawl-scrape

Un frein fréquent à l’adoption vient des pages qui s’affichent correctement dans un navigateur, mais renvoient un contenu incomplet avec des méthodes de fetch simples. firecrawl-scrape traite ce cas grâce à un scraping sensible au rendu. En pratique, si le contenu apparaît tardivement, ajoutez --wait-for avec un délai réaliste comme 3000.

Utilisez un temps d’attente de rendu lorsque :

les spécifications produit se remplissent après le chargement de la page
le contenu documentaire s’hydrate côté client
les tableaux tarifaires n’apparaissent qu’après exécution des scripts

N’ajoutez pas de longs délais par défaut. Commencez modestement et n’augmentez le délai que si la sortie montre clairement qu’il manque du contenu.

Comment scraper efficacement plusieurs URL avec firecrawl-scrape

La compétence prend en charge plusieurs URL dans une seule commande et précise qu’elles sont scrapées en parallèle. C’est utile pour de petits lots de pages connues comme :

plusieurs pages de documentation
une page d’accueil, une page tarifaire et une FAQ
un ensemble d’articles de blog déjà sélectionnés

Exemple :

firecrawl scrape https://example.com https://example.com/blog https://example.com/docs

C’est plus approprié qu’un crawl lorsque vous connaissez déjà exactement les cibles.

Comment obtenir à la fois le markdown et les liens

Si l’étape suivante dépend à la fois d’un contenu lisible et de références de page, demandez plusieurs formats :

firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

C’est un très bon choix pour des workflows tels que :

extraire le contenu, puis examiner les liens sortants
construire des notes avec citations
séparer le texte principal de la navigation et des destinations référencées

Choisissez une sortie JSON si vous avez besoin d’un post-traitement structuré plutôt que d’un simple fichier markdown.

Comment utiliser firecrawl-scrape pour des questions ciblées

L’un des usages les plus pratiques de firecrawl-scrape consiste à poser une question spécifique à la page au moment du scraping :

firecrawl scrape "https://example.com/pricing" --query "What is the enterprise plan price?"

Cette approche fonctionne le mieux lorsque :

la réponse a de fortes chances de se trouver sur une seule page
vous voulez une extraction ciblée plutôt qu’une revue complète de la page
vous voulez réduire le temps de lecture manuelle

Elle est moins adaptée lorsque la réponse s’étend sur plusieurs pages ou exige de comparer plusieurs documents.

Transformer une demande floue en prompt solide

Demande faible :

« Scrape ce site et dis-moi ce qui compte. »

Demande solide :

« Use firecrawl-scrape on https://example.com/pricing with --only-main-content. Save markdown to .firecrawl/pricing.md. Then extract plan names, monthly prices, annual billing notes, and enterprise contact language. »

Pourquoi c’est mieux :

l’URL est spécifique
le bon mode de sortie est choisi
ce qu’il faut extraire après le scraping est défini
l’ambiguïté sur le périmètre est réduite

Workflow conseillé pour firecrawl-scrape pour le Web Scraping

Une séquence pratique efficace est la suivante :

Confirmer que vous avez l’URL exacte de la page.
Commencer par une extraction en markdown.
Ajouter --only-main-content si la page est bruitée.
Ajouter --wait-for s’il manque du contenu rendu.
Passer à --format markdown,links si la structure des liens compte.
Utiliser --query seulement lorsque la tâche est étroite et limitée à la page.

Cela suit le positionnement de la compétence source, qui présente le scrape comme une étape intermédiaire dans un workflow plus large : search → scrape → map → crawl → interact.

Fichiers du dépôt à lire en premier

Commencez par lire skills/firecrawl-scrape/SKILL.md. C’est là que se trouve presque toute la valeur pratique :

quand utiliser la compétence
les commandes de démarrage rapide
les options prises en charge
les conseils d’usage

Comme cette fiche du répertoire de compétences est orientée décision d’installation, le point clé à retenir avant installation est simple : le document source est concis, et il n’y a ni scripts auxiliaires ni références supplémentaires à examiner avant de l’essayer.

Conseils d’adoption concrets qui changent vraiment la qualité de sortie

Quelques choix pèsent beaucoup plus que d’autres :

Préférez des URL exactes aux domaines de premier niveau.
Utilisez --only-main-content pour les tâches centrées sur l’analyse.
N’utilisez --wait-for que lorsque la sortie est visiblement incomplète.
Enregistrez les sorties dans .firecrawl/ pour pouvoir inspecter les résultats bruts avant d’enchaîner avec plus d’automatisation.
Utilisez --query pour des faits locaux à la page, pas pour une recherche ouverte.

Ces petites décisions comptent généralement davantage que l’ajout de formulations supplémentaires dans le prompt.

FAQ sur la compétence firecrawl-scrape

firecrawl-scrape est-il meilleur qu’un prompt classique avec une URL ?

Oui, dans la plupart des cas, si le travail consiste réellement à extraire une page web. La firecrawl-scrape skill fournit un chemin d’appel clair, gère les pages rendues en JS, peut renvoyer du markdown ou des liens, et expose des options propres au scraping. Un prompt classique peut suffire pour une lecture simple, mais il est moins fiable quand les pages nécessitent un rendu ou une structure de sortie plus propre.

Quand utiliser firecrawl-scrape plutôt que WebFetch ?

Utilisez firecrawl-scrape lorsque vous voulez faire de l’extraction de contenu de page web. La compétence source le recommande explicitement à la place de WebFetch pour cet usage. Cette recommandation est particulièrement pertinente pour les pages rendues, une sortie markdown plus propre et des workflows de scraping qui ont besoin d’un comportement CLI reproductible.

firecrawl-scrape est-il accessible aux débutants ?

Oui, comparé à beaucoup d’outils de scraping. Le parcours de première utilisation est court : fournir une URL, lancer une commande, inspecter la sortie. Il n’est pas nécessaire de comprendre une stratégie de crawl complète pour en tirer de la valeur. Le point principal à comprendre pour les débutants est que l’on parle ici de scraping de page, pas d’exploration de site à grande échelle.

firecrawl-scrape peut-il gérer les SPA et les pages dynamiques ?

Oui. C’est même l’une de ses raisons d’exister. Si une page dépend d’un rendu JavaScript, utilisez --wait-for lorsque nécessaire afin de laisser le temps au contenu d’apparaître avant l’extraction.

Dans quels cas firecrawl-scrape est-il un mauvais choix ?

Évitez-le lorsque :

vous ne connaissez pas encore l’URL cible
vous avez besoin d’une découverte large sur un domaine
vous avez besoin d’un parcours récursif du site
votre tâche demande de l’interaction plutôt que de l’extraction
la réponse doit être synthétisée à partir de nombreuses pages que vous n’avez pas encore identifiées

Dans ces cas-là, search, map, crawl ou d’autres outils constituent une meilleure première étape.

Faut-il installer tout le dépôt pour utiliser firecrawl-scrape ?

Vous avez besoin d’un accès au comportement de la CLI Firecrawl auquel la compétence fait référence, mais la compétence elle-même reste légère. Pour prendre une décision, la charge côté dépôt est faible : les consignes pratiques sont concentrées dans SKILL.md, et il n’y a ni scripts compagnons ni dossiers de ressources à maîtriser au préalable.

Comment améliorer la compétence firecrawl-scrape

Donner à firecrawl-scrape des objectifs plus étroits

Le problème de qualité le plus courant vient d’une intention trop large. Vous obtiendrez de meilleurs résultats avec des demandes comme :

« extraire le tableau tarifaire »
« renvoyer le markdown plus les liens »
« répondre à cette question unique à partir de la page »
plutôt que :
« scrape tout ce qui est utile »

Plus la tâche sur la page est resserrée, moins vous aurez de nettoyage à faire ensuite.

Améliorer les entrées avec des consignes conscientes de la page

De bonnes entrées combinent URL, mode de sortie et cible d’extraction. Exemple :

firecrawl scrape "https://example.com/docs/auth" \
  --only-main-content \
  -o .firecrawl/auth.md

Ensuite, dites exactement à l’agent quoi faire avec ce fichier :

résumer les étapes de configuration
lister les en-têtes requis
extraire les exemples de code
comparer les méthodes d’authentification

Ce schéma en deux étapes est souvent plus fiable que de demander à la fois le scraping et l’analyse dans une seule requête vague.

Corriger le contenu manquant avant de changer tout le workflow

Si la sortie paraît trop maigre, commencez par vérifier si la page a besoin d’un temps de rendu :

firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

Beaucoup d’utilisateurs changent d’outil trop tôt alors que le vrai problème est simplement que la page n’avait pas fini de se rendre.

Réduire le bruit avant l’analyse en aval

Si le résultat est rempli d’éléments de navigation, de texte de cookies ou de contenu de pied de page, passez à :

firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

Cela améliore souvent :

la qualité des résumés
la précision de l’extraction
l’efficacité en tokens
la cohérence entre des pages similaires

Utiliser une sortie structurée si vous prévoyez d’automatiser

Si la page scrapée alimente une autre étape, demandez dès le départ des formats structurés plutôt que de reparcourir le markdown plus tard :

firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

Cela facilite aussi les décisions autour de firecrawl-scrape install : si votre workflow dépend d’une automatisation sensible aux liens, cette compétence est plus clairement adaptée que de simples outils de fetch textuel.

Itérer après le premier run, pas avant

Un bon modèle de firecrawl-scrape guide consiste à :

lancer le scrape le plus simple
inspecter ce qui manque ou ce qui est bruité
ajouter une option pour corriger ce problème précis
relancer et comparer

Chemin d’itération typique :

scrape de base
ajout de --only-main-content
ajout de --wait-for
ajout de --format markdown,links
utilisation de --query pour une extraction directe

C’est plus rapide que de concevoir une commande complexe avant d’avoir vu la sortie de la page.

Points de défaillance fréquents à surveiller

Les principaux problèmes pratiques sont :

utiliser une page d’accueil alors que la vraie cible est une sous-page
attendre de scrape un comportement de type crawl
ne pas attendre le contenu rendu en JS
poser avec --query des questions qui nécessitent plusieurs pages
n’enregistrer que des résumés finaux au lieu de conserver la sortie brute du scrape

La plupart de ces erreurs peuvent être évitées avec un périmètre plus clair et une passe d’inspection.

Comment les utilisateurs avancés tirent davantage de firecrawl-scrape

Les utilisateurs avancés améliorent généralement les résultats en combinant firecrawl-scrape avec des étapes ultérieures, plutôt qu’en compliquant excessivement le scrape lui-même. Un schéma solide consiste à :

scraper proprement des pages exactes
sauvegarder les sorties brutes
effectuer ensuite l’extraction, la comparaison ou la synthèse

Cela permet à firecrawl-scrape for Web Scraping de rester concentré sur la couche de récupération de pages, là où il est le plus performant.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

huggingface-datasets

par huggingface

Utilisez le skill huggingface-datasets pour les workflows de l’API Hugging Face Dataset Viewer afin de valider des datasets, résoudre les splits, prévisualiser et paginer les lignes, rechercher du texte, appliquer des filtres, et récupérer des liens Parquet ou des statistiques. C’est un guide pratique huggingface-datasets pour explorer des datasets en lecture seule.

Web Scraping

Favoris 0GitHub 10.4k

data-scraper-agent

par affaan-m

data-scraper-agent aide à mettre en place un pipeline de données publiques reproductible pour le web scraping, l’enrichissement et le stockage. Il est conçu pour suivre des jobs, des prix, des actualités, des repos, des résultats sportifs et des annonces selon un planning, via GitHub Actions, avec des sorties vers Notion, Sheets ou Supabase. Idéal pour un suivi continu, pas pour des extractions ponctuelles.

Web Scraping

Favoris 0GitHub 156.1k

baoyu-url-to-markdown

par JimLiu

baoyu-url-to-markdown convertit des URL en direct en Markdown via le CLI embarqué baoyu-fetch, avec Chrome CDP, des adaptateurs par site et un mode de repli générique. Vérifiez les exigences d’exécution avec Bun, la configuration initiale de `EXTEND.md`, ainsi que l’usage pour X, YouTube, Hacker News et les pages rendues.

Format Conversion

Favoris 0GitHub 13.2k

x-twitter-scraper

par Xquik-dev

Utilisez x-twitter-scraper pour récupérer des données X (Twitter) et exécuter des actions soumises à confirmation via Xquik. L’outil prend en charge la recherche de tweets, la consultation d’utilisateurs, l’extraction de followers, le téléchargement de médias, les monitors, les webhooks, MCP et les actions d’écriture. Idéal pour des recherches de type web scraping avec une clé API, sans avoir à utiliser des identifiants de connexion X.

Web Scraping

Favoris 0GitHub 71

exa-search

par K-Dense-AI

exa-search est un skill de recherche web propulsé par Exa, conçu pour trouver des informations à jour et extraire du contenu depuis des URLs. Utilisez-le pour la recherche web, la découverte de sources, l’extraction d’articles et de PDF, ainsi que pour des recherches techniques ou scientifiques grâce à une récupération sémantique, un filtrage de type académique et des indications claires d’installation et d’utilisation.

Web Research

Favoris 0GitHub 0

browser-use

par browser-use

browser-use est une skill d’automatisation de navigateur qui permet d’ouvrir des pages, d’inspecter l’état, de cliquer sur des éléments indexés, de saisir du texte dans des champs, de prendre des captures d’écran et de réutiliser une session de navigateur persistante. Utilisez-la pour le remplissage fiable de formulaires, la navigation et les workflows en mode connecté avec la CLI browser-use.

Browser Automation

Favoris 0GitHub 84.9k

remote-browser

par browser-use

remote-browser aide les agents isolés en sandbox à piloter un navigateur headless pour l’automatisation du navigateur. Utilisez-le pour ouvrir des pages, inspecter l’état, cliquer sur des éléments indexés, saisir du texte, prendre des captures d’écran et se connecter à des applications locales ou à des sessions de navigateur compatibles CDP.

Browser Automation

Favoris 0GitHub 84.9k

firecrawl

par firecrawl

Skill firecrawl pour installer, authentifier et utiliser le CLI officiel Firecrawl pour le scraping web, la recherche, le crawl et l’interaction avec les pages. Découvrez la configuration, `firecrawl --status`, la connexion, l’écriture sécurisée des fichiers dans `.firecrawl/` et des usages concrets appuyés par le repo.

Web Scraping

Favoris 0GitHub 234

firecrawl-search

par firecrawl

firecrawl-search est une skill de recherche web conçue pour trouver des sources, effectuer des recherches structurées et, si besoin, extraire le contenu complet de pages au format JSON avec Firecrawl CLI.

Web Research

Favoris 0GitHub 234

parallel-web

par K-Dense-AI

parallel-web est une skill de recherche et d’extraction web propulsée par parallel-cli. Elle vous aide à rechercher sur le web, extraire le contenu d’URL, enrichir des données à partir de sources et mener des recherches approfondies en privilégiant les sources académiques et scientifiques. Utilisez-la pour l’usage de parallel-web, la recherche web, les citations et les workflows fondés sur les preuves.

Web Research

Favoris 0GitHub 0

geomaster

par K-Dense-AI

geomaster est une compétence de science géospatiale pour les workflows GIS, de télédétection, d’analyse spatiale et d’observation de la Terre. Utilisez-la pour des tâches d’analyse de données comme les opérations raster et vectorielles, le traitement d’imagerie satellite, les métriques spatiales et la planification de workflows. Le guide geomaster vous aide à installer, inspecter et appliquer la compétence avec moins d’hésitation.

Data Analysis

Favoris 0GitHub 0

asc-aso-audit

par rudrankriyam

asc-aso-audit vous aide à réaliser un audit ASO hors ligne sur les métadonnées App Store canoniques dans `./metadata`, puis à faire ressortir les écarts de mots-clés avec Astro MCP. Utilisez la compétence asc-aso-audit après `asc metadata pull` pour passer en revue `subtitle`, `keywords`, `description` et `whatsNew` avec moins de suppositions.

Data Analysis

Favoris 0GitHub 0

ffuf-web-fuzzing

par jthack

ffuf-web-fuzzing est une compétence pratique pour découvrir du contenu web caché, tester des routes et des paramètres, et fuzzifier des cibles authentifiées avec des requêtes brutes, un auto-calibrage et l’analyse des résultats. Elle convient aux testeurs en sécurité qui ont besoin d’un guide ffuf-web-fuzzing reproductible pour les tests d’intrusion et les workflows d’audit de sécurité.

Security Audit

Favoris 0GitHub 0

web-to-markdown

par softaworks

web-to-markdown est un skill de conversion de format qui transforme des pages web en direct en Markdown propre via le CLI local `web2md`, en s’appuyant sur un navigateur de la famille Chromium pour les pages rendues en JS, les parcours interactifs et la conversion par lots d’URL. Il ne s’exécute que lorsqu’il est explicitement invoqué par son nom.

Format Conversion

Favoris 0GitHub 1.3k

firecrawl-agent

par firecrawl

firecrawl-agent aide à extraire du JSON structuré depuis des sites web complexes à plusieurs pages. Découvrez dans quels cas l’utiliser, comment lancer l’agent Firecrawl CLI, ajouter des schémas, définir des URL de départ et enregistrer les résultats pour l’extraction de tarifs, de catalogues produits et de données de type annuaire.

Web Scraping

Favoris 0GitHub 234

firecrawl-map

par firecrawl

firecrawl-map aide les agents à découvrir et lister les URL d’un site, avec des options de filtrage par recherche, de limitation, de sortie JSON, de modes sitemap et de contrôle des sous-domaines avant un scraping ou un crawl plus approfondi.

Web Scraping

Favoris 0GitHub 234