Web Scraping

Explorez les agent skills lies a Web Scraping dans Traitement des donnees et comparez les workflows, outils et cas d usage associes.

10 skills
B
remote-browser

by browser-use

remote-browser aide les agents isolés en sandbox à piloter un navigateur headless pour l’automatisation du navigateur. Utilisez-le pour ouvrir des pages, inspecter l’état, cliquer sur des éléments indexés, saisir du texte, prendre des captures d’écran et se connecter à des applications locales ou à des sessions de navigateur compatibles CDP.

Browser Automation
Favorites 0GitHub 84.9k
B
browser-use

by browser-use

browser-use est une skill d’automatisation de navigateur qui permet d’ouvrir des pages, d’inspecter l’état, de cliquer sur des éléments indexés, de saisir du texte dans des champs, de prendre des captures d’écran et de réutiliser une session de navigateur persistante. Utilisez-la pour le remplissage fiable de formulaires, la navigation et les workflows en mode connecté avec la CLI browser-use.

Browser Automation
Favorites 0GitHub 84.9k
F
firecrawl-agent

by firecrawl

firecrawl-agent aide à extraire du JSON structuré depuis des sites web complexes à plusieurs pages. Découvrez dans quels cas l’utiliser, comment lancer l’agent Firecrawl CLI, ajouter des schémas, définir des URL de départ et enregistrer les résultats pour l’extraction de tarifs, de catalogues produits et de données de type annuaire.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-browser

by firecrawl

firecrawl-browser est une skill Firecrawl d’automatisation web interactive. Elle est désormais dépréciée en tant que commande navigateur autonome et oriente maintenant les utilisateurs vers `firecrawl scrape` puis `firecrawl interact` pour les clics, les formulaires, les parcours de connexion, la pagination et les pages riches en JavaScript.

Browser Automation
Favorites 0GitHub 234
F
firecrawl

by firecrawl

Skill firecrawl pour installer, authentifier et utiliser le CLI officiel Firecrawl pour le scraping web, la recherche, le crawl et l’interaction avec les pages. Découvrez la configuration, `firecrawl --status`, la connexion, l’écriture sécurisée des fichiers dans `.firecrawl/` et des usages concrets appuyés par le repo.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-crawl

by firecrawl

firecrawl-crawl aide les agents à extraire en masse le contenu d’un site web ou d’une section de documentation grâce à des filtres de chemin, des limites de profondeur, des plafonds de pages, un mode d’attente et des vérifications de statut de tâche.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-download

by firecrawl

firecrawl-download permet de télécharger un site ou une section de documentation dans des fichiers locaux bien organisés sous `.firecrawl/`. Il combine cartographie du site et scraping, prend en charge le markdown, les liens et les captures d’écran, et convient bien aux copies hors ligne de documentation, à la capture en masse de pages et à des workflows Web Scraping concrets.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-search

by firecrawl

firecrawl-search est une skill de recherche web conçue pour trouver des sources, effectuer des recherches structurées et, si besoin, extraire le contenu complet de pages au format JSON avec Firecrawl CLI.

Web Research
Favorites 0GitHub 234
F
firecrawl-map

by firecrawl

firecrawl-map aide les agents à découvrir et lister les URL d’un site, avec des options de filtrage par recherche, de limitation, de sortie JSON, de modes sitemap et de contrôle des sous-domaines avant un scraping ou un crawl plus approfondi.

Web Scraping
Favorites 0GitHub 234
F
firecrawl-scrape

by firecrawl

firecrawl-scrape permet d’extraire un contenu propre et adapté aux LLM à partir d’URL connues, y compris sur des pages rendues en JS. Utilisez-le pour récupérer du markdown, des liens ou des réponses ciblées sur une page avec Firecrawl CLI ou `npx firecrawl`.

Web Scraping
Favorites 0GitHub 234