Scraping

Explorez les agent skills avec le tag Scraping et comparez les workflows associes dans le repertoire.

15 skills

browser-use

par browser-use

browser-use est une skill d’automatisation de navigateur qui permet d’ouvrir des pages, d’inspecter l’état, de cliquer sur des éléments indexés, de saisir du texte dans des champs, de prendre des captures d’écran et de réutiliser une session de navigateur persistante. Utilisez-la pour le remplissage fiable de formulaires, la navigation et les workflows en mode connecté avec la CLI browser-use.

Browser Automation

Favoris 0GitHub 84.9k

baoyu-url-to-markdown

par JimLiu

baoyu-url-to-markdown convertit des URL en direct en Markdown via le CLI embarqué baoyu-fetch, avec Chrome CDP, des adaptateurs par site et un mode de repli générique. Vérifiez les exigences d’exécution avec Bun, la configuration initiale de `EXTEND.md`, ainsi que l’usage pour X, YouTube, Hacker News et les pages rendues.

Format Conversion

Favoris 0GitHub 13.2k

multi-search-engine

par openclaw

multi-search-engine est une compétence de recherche web qui prend en charge 17 moteurs de recherche, des opérateurs avancés, des filtres temporels, des options axées sur la confidentialité et des requêtes WolframAlpha. Elle aide les agents à construire et exécuter de meilleures URL de recherche sans clés API.

Web Research

Favoris 0GitHub 3.8k

web-to-markdown

par softaworks

web-to-markdown est un skill de conversion de format qui transforme des pages web en direct en Markdown propre via le CLI local `web2md`, en s’appuyant sur un navigateur de la famille Chromium pour les pages rendues en JS, les parcours interactifs et la conversion par lots d’URL. Il ne s’exécute que lorsqu’il est explicitement invoqué par son nom.

Format Conversion

Favoris 0GitHub 1.3k

firecrawl-agent

par firecrawl

firecrawl-agent aide à extraire du JSON structuré depuis des sites web complexes à plusieurs pages. Découvrez dans quels cas l’utiliser, comment lancer l’agent Firecrawl CLI, ajouter des schémas, définir des URL de départ et enregistrer les résultats pour l’extraction de tarifs, de catalogues produits et de données de type annuaire.

Web Scraping

Favoris 0GitHub 234

firecrawl-browser

par firecrawl

firecrawl-browser est une skill Firecrawl d’automatisation web interactive. Elle est désormais dépréciée en tant que commande navigateur autonome et oriente maintenant les utilisateurs vers `firecrawl scrape` puis `firecrawl interact` pour les clics, les formulaires, les parcours de connexion, la pagination et les pages riches en JavaScript.

Browser Automation

Favoris 0GitHub 234

firecrawl

par firecrawl

Skill firecrawl pour installer, authentifier et utiliser le CLI officiel Firecrawl pour le scraping web, la recherche, le crawl et l’interaction avec les pages. Découvrez la configuration, `firecrawl --status`, la connexion, l’écriture sécurisée des fichiers dans `.firecrawl/` et des usages concrets appuyés par le repo.

Web Scraping

Favoris 0GitHub 234

firecrawl-crawl

par firecrawl

firecrawl-crawl aide les agents à extraire en masse le contenu d’un site web ou d’une section de documentation grâce à des filtres de chemin, des limites de profondeur, des plafonds de pages, un mode d’attente et des vérifications de statut de tâche.

Web Scraping

Favoris 0GitHub 234

firecrawl-download

par firecrawl

firecrawl-download permet de télécharger un site ou une section de documentation dans des fichiers locaux bien organisés sous `.firecrawl/`. Il combine cartographie du site et scraping, prend en charge le markdown, les liens et les captures d’écran, et convient bien aux copies hors ligne de documentation, à la capture en masse de pages et à des workflows Web Scraping concrets.

Web Scraping

Favoris 0GitHub 234

firecrawl-search

par firecrawl

firecrawl-search est une skill de recherche web conçue pour trouver des sources, effectuer des recherches structurées et, si besoin, extraire le contenu complet de pages au format JSON avec Firecrawl CLI.

Web Research

Favoris 0GitHub 234

firecrawl-map

par firecrawl

firecrawl-map aide les agents à découvrir et lister les URL d’un site, avec des options de filtrage par recherche, de limitation, de sortie JSON, de modes sitemap et de contrôle des sous-domaines avant un scraping ou un crawl plus approfondi.

Web Scraping

Favoris 0GitHub 234

firecrawl-scrape

par firecrawl

firecrawl-scrape permet d’extraire un contenu propre et adapté aux LLM à partir d’URL connues, y compris sur des pages rendues en JS. Utilisez-le pour récupérer du markdown, des liens ou des réponses ciblées sur une page avec Firecrawl CLI ou `npx firecrawl`.

Web Scraping

Favoris 0GitHub 234

x-twitter-scraper

par Xquik-dev

Utilisez x-twitter-scraper pour récupérer des données X (Twitter) et exécuter des actions soumises à confirmation via Xquik. L’outil prend en charge la recherche de tweets, la consultation d’utilisateurs, l’extraction de followers, le téléchargement de médias, les monitors, les webhooks, MCP et les actions d’écriture. Idéal pour des recherches de type web scraping avec une clé API, sans avoir à utiliser des identifiants de connexion X.

Web Scraping

Favoris 0GitHub 71

tweetclaw

par Xquik-dev

tweetclaw est le plugin OpenClaw installable pour des workflows structurés sur X/Twitter. Cette skill tweetclaw couvre l’installation, la configuration, les limites liées aux identifiants, l’approbation explicite pour les écritures et les actions payantes, la gestion des données privées, les contrôles de monitoring et l’usage concret de tweetclaw pour des opérations Social Media plus sûres.

Social Media

Favoris 0GitHub 37

par ReScienceLab

Le skill Reddit récupère des publications Reddit, des fils de commentaires, des métadonnées de subreddits et des profils utilisateur via l’API JSON publique. Il est conçu pour la recherche sur Reddit, l’exploration de subreddits et la recherche web appuyée par des sources quand vous avez besoin de vrais posts plutôt que d’un résumé générique. Aucune clé API n’est requise.

Web Research

Favoris 0GitHub 0