browse

par garrytan

browse est une compétence de navigateur headless rapide pour l’assurance qualité, le dogfooding et l’automatisation du navigateur. Utilisez-la pour ouvrir des pages, interagir avec des éléments, vérifier l’état, comparer l’avant et l’après d’actions, capturer des captures d’écran et contrôler les mises en page responsives, les formulaires, les envois de fichiers, les boîtes de dialogue et l’état des éléments. Installez browse quand vous avez besoin de preuves concrètes du navigateur plutôt que d’une simple consigne générique.

Étoiles91.8k

Favoris0

Commentaires0

Ajouté9 mai 2026

CatégorieBrowser Automation

Commande d’installation

npx skills add garrytan/gstack --skill browse

Score éditorial

Cette compétence obtient 78/100, ce qui en fait une bonne candidate pour un annuaire destiné aux utilisateurs qui ont besoin d’un flux de travail headless rapide dans le navigateur pour le QA, le dogfooding, les captures d’écran et la vérification d’état. Le dépôt montre suffisamment de contenu opérationnel réel pour qu’un agent puisse probablement le déclencher et l’utiliser avec moins d’hésitation qu’avec une consigne générique, même si les utilisateurs doivent s’attendre à un peu de friction au démarrage en raison de l’absence d’indications claires sur la commande d’installation et de quelques marqueurs de remplacement.

78/100

Points forts

Langage de déclenchement explicite et cas d’usage dans `SKILL.md` : "browse a page", "headless browser", "take page screenshot", ainsi que les tests QA, la vérification de déploiement et les preuves de bogues.
Corps de compétence volumineux et très orienté workflow, avec de nombreux titres et des signaux sur le périmètre, le déroulé, les contraintes et les étapes pratiques, ce qui suggère de vraies consignes opérationnelles plutôt qu’un simple squelette.
Le code et les scripts d’accompagnement indiquent un système de compétence navigateur fonctionnel, avec intégration client/serveur, journalisation d’activité/audit et script de build pour la compatibilité Node.

Points de vigilance

L’extrait de `SKILL.md` montre des marqueurs de remplacement et aucune commande d’installation, donc la première mise en place peut demander d’explorer davantage le dépôt.
La description est large, mais les éléments visibles dans l’annuaire ne fournissent ni guide de démarrage rapide concis ni documentation de référence, ce qui peut ralentir l’adoption pour les utilisateurs qui veulent exécuter immédiatement et avec confiance.

Testing Screenshots Responsive Design Forms JavaScript TypeScript Playwright

Vue d’ensemble

Vue d’ensemble de browse

À quoi sert browse

Le skill browse est un outil de navigateur headless rapide pour l’assurance qualité, le dogfooding et l’automatisation de navigateur. Il est conçu pour les situations où vous devez ouvrir une page, interagir avec elle, vérifier un état, comparer l’avant et l’après d’une action, ou capturer des preuves comme des captures d’écran et des vérifications d’état d’éléments. Si votre mission est « tester ce flux dans un navigateur et me dire ce qui s’est passé », browse est le bon choix.

Qui devrait l’installer

Installez browse si vous validez régulièrement des pages web, des démos, des formulaires, des mises en page responsives, des envois de fichiers, des dialogues ou des vérifications de déploiement. Il est particulièrement utile pour les agents qui doivent prouver un comportement d’interface avec des captures d’écran ou des assertions d’état, plutôt que de s’appuyer sur un simple prompt générique. Il est moins pertinent pour les tâches purement backend ou la simple lecture de pages.

Ce qui distingue browse

Le skill browse repose sur une exécution réelle du navigateur, pas seulement sur l’inspection textuelle d’une page. Le repo indique la prise en charge du routage des commandes, de la gestion du navigateur, du pont CDP, de la capture réseau, de la gestion des cookies et des vérifications visuelles annotées. Autrement dit, browse vise l’automatisation pratique du navigateur avec preuves à l’appui, pas un simple utilitaire léger pour « résumer ce site ».

Comment utiliser browse

Installer browse correctement

Utilisez le chemin d’installation indiqué dans la documentation du skill ou la commande d’ajout de votre gestionnaire de skills, puis vérifiez que le skill est bien détectable dans votre répertoire local de skills. Le repo contient des shims d’aide comme bin/find-browse, ce qui suggère que browse est pensé pour être localisé et lancé depuis une installation qui connaît l’espace de travail. Si le binaire manque, le premier réflexe consiste généralement à relancer le parcours d’installation/build du skill plutôt qu’à réécrire les prompts.

Donner une tâche précise à browse, pas un objectif vague

Une bonne utilisation de browse commence par une mission navigateur explicite : URL, action, résultat attendu et type de preuve à renvoyer. Un bon exemple : « Ouvre la page de connexion, soumets des identifiants valides, confirme la redirection vers /dashboard, puis renvoie une capture d’écran et toute erreur de console ou réseau. » Un input faible comme « teste le site » laisse trop d’ambiguïté dans le routage.

Lire ces fichiers en premier

Pour décider si l’installation et l’usage conviennent, commencez par SKILL.md, puis consultez PLAN-snapshot-dropdown-interactive.md pour les contraintes de workflow déjà connues, SKILL.md.tmpl pour voir comment le skill est généré, ainsi que bin/find-browse et bin/remote-slug pour comprendre la résolution des chemins et du repo. Si vous évaluez l’adéquation à l’automatisation de navigateur, parcourez aussi src/browser-manager.ts, src/cdp-bridge.ts et src/browser-skill-commands.ts afin de savoir ce que le skill peut réellement exécuter.

Utiliser le skill dans un workflow

Un workflow browse fiable suit généralement cette logique : définir l’état de page recherché, lancer l’action navigateur, vérifier le résultat, puis itérer sur la contrainte suivante. Par exemple, précisez dès le départ la largeur responsive, les champs du formulaire ou les changements DOM attendus afin que browse puisse tout vérifier en un seul passage. Cela réduit les allers-retours et rend le premier essai plus utile qu’un prompt générique.

FAQ sur browse

browse sert-il uniquement aux captures d’écran ?

Non. Les captures d’écran ne sont qu’un type de sortie. Le skill sert aussi à la navigation, à l’interaction, à la vérification d’état, aux tests responsives, aux formulaires, aux téléversements et à la constitution de preuves de bugs. Si votre besoin réel est « prouver ce comportement de navigateur », browse est plus complet qu’un outil limité aux screenshots.

En quoi browse diffère-t-il d’un prompt normal ?

Un prompt classique demande à un agent de raisonner sur une tâche de navigateur. Le skill browse fournit à l’agent un chemin d’exécution spécifique au navigateur, avec routage des commandes et vérifications d’état du navigateur. En pratique, cela signifie moins d’à-peu-près, une meilleure reproductibilité et des preuves plus claires lorsqu’un flux échoue.

browse est-il adapté aux débutants ?

Oui, si vous savez décrire clairement une tâche de navigateur. Les débutants obtiennent les meilleurs résultats lorsqu’ils fournissent une URL, une action, un résultat attendu et une demande de preuve. Si vous savez déjà rédiger un cas de test, vous pouvez généralement utiliser browse efficacement dès le premier essai.

Quand ne faut-il pas utiliser browse ?

N’utilisez pas browse si vous avez seulement besoin d’extraire du contenu statique, d’inspecter un repo ou d’obtenir une réponse de code classique. C’est aussi un mauvais choix si vous ne pouvez pas préciser une cible de navigateur, ou si la tâche ne nécessite pas une page réellement rendue. Dans ces cas-là, un prompt d’agent standard est plus simple.

Comment améliorer browse

Fournir des entrées navigateur plus solides

Les meilleurs résultats avec browse viennent d’inputs qui nomment la page, l’action utilisateur, la condition de succès et l’artefact à renvoyer. Par exemple : « Sur la page de tarifs, passe à la facturation annuelle, confirme que le total se met à jour et capture une capture d’écran de l’état final. » C’est mieux que « vérifie les tarifs », car cela enlève l’ambiguïté sur ce que signifie la réussite.

Surveiller les modes d’échec courants

Le mode d’échec le plus fréquent de browse est la sous-spécification : URL manquante, état manquant ou résultat attendu absent. Le deuxième consiste à demander une preuve visuelle sans préciser quelle zone de la page compte vraiment. Si la tâche implique des formulaires, des menus, des dialogues ou du contenu dynamique, dites-le explicitement ; ces détails ont un impact concret sur l’usage de browse.

Itérer après le premier passage

Si le premier résultat est proche mais incomplet, affinez le prompt suivant avec l’écart exact : viewport incorrect, élément manqué, état obsolète ou preuve réseau absente. Browse est le plus utile quand chaque passage réduit l’incertitude. Servez-vous du résultat pour ajouter des contraintes, plutôt que de reformuler la même demande.

Ajuster browse pour Browser Automation

Pour l’automatisation de navigateur, ajoutez des éléments concrets : type de compte de test, taille d’écran, locale, et importance ou non des cookies et de l’état de connexion. Si vous validez un bug, incluez l’étape de reproduction et l’écart attendu/réel. Cela permet à browse de se comporter comme un assistant d’automatisation de navigateur plutôt que comme un simple preneur de notes QA, et produit généralement de meilleures preuves dès le premier passage.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

playwright-interactive

par openai

playwright-interactive est une compétence d’automatisation navigateur pour des sessions Playwright persistantes dans des applications web locales et Electron. Utilisez-la pour inspecter l’état de l’interface, réessayer des interactions et lancer des vérifications fonctionnelles ou visuelles sans redémarrer la chaîne d’outils. Idéale si vous avez besoin d’un guide pratique playright-interactive pour un débogage itératif.

Browser Automation

Favoris 0GitHub 0

playwright-skill

par testdino-hq

playwright-skill est un guide spécifique à Playwright pour une automatisation fiable des navigateurs. Il aide les équipes à écrire, déboguer et faire évoluer des tests pour les parcours E2E, les vérifications d’API, les tests de composants, la régression visuelle, l’accessibilité, l’authentification, la CI/CD et la migration depuis Cypress ou Selenium. Utilisez le skill playwright-skill lorsque vous voulez des pratiques concrètes plutôt que des conseils génériques sur les tests.

Test Automation

Favoris 0GitHub 0

data-scraper-agent

par affaan-m

data-scraper-agent aide à mettre en place un pipeline de données publiques reproductible pour le web scraping, l’enrichissement et le stockage. Il est conçu pour suivre des jobs, des prix, des actualités, des repos, des résultats sportifs et des annonces selon un planning, via GitHub Actions, avec des sorties vers Notion, Sheets ou Supabase. Idéal pour un suivi continu, pas pour des extractions ponctuelles.

Web Scraping

Favoris 0GitHub 156.1k

read

par tw93

Le skill read récupère des URL et des PDF sous forme de Markdown propre, prêt à lire, citer et réutiliser dans des travaux en aval. Il est conçu pour un usage de lecture sur des pages protégées par un paywall, des sites riches en JavaScript, X/Twitter, des fichiers GitHub, des plateformes chinoises et des flux d’automatisation nécessitant un texte source fiable avant analyse. Utilisez le guide read quand vous voulez capturer la source, pas obtenir des commentaires.

Workflow Automation

Favoris 0GitHub 5.1k

playwright-best-practices

par currents-dev

playwright-best-practices est une skill Playwright + TypeScript conçue pour écrire des tests stables, réduire le flakiness, fiabiliser les flux d’authentification, choisir entre fixtures et page objects, et gérer la CI, les popups, le mobile, les iframes, les websockets et les scénarios multi-utilisateurs grâce à des recommandations pratiques appuyées par le dépôt.

Test Automation

Favoris 0GitHub 174

x-twitter-scraper

par Xquik-dev

Utilisez x-twitter-scraper pour récupérer des données X (Twitter) et exécuter des actions soumises à confirmation via Xquik. L’outil prend en charge la recherche de tweets, la consultation d’utilisateurs, l’extraction de followers, le téléchargement de médias, les monitors, les webhooks, MCP et les actions d’écriture. Idéal pour des recherches de type web scraping avec une clé API, sans avoir à utiliser des identifiants de connexion X.

Web Scraping

Favoris 0GitHub 71

composio

par ComposioHQ

Utilisez composio pour connecter des workflows d’IA à des applications externes via le CLI ou le SDK. Cette skill composio est conçue pour l’automatisation des workflows, les actions d’apps, les connexions par utilisateur, la découverte de toolkit et un guide pratique d’installation et d’utilisation avant de commencer à construire.

Workflow Automation

Favoris 0GitHub 48

playwright-skill

par lackeyjb

playwright-skill est une compétence d’automatisation navigateur pour tester des pages, remplir des formulaires, vérifier des liens, prendre des captures d’écran, valider des mises en page responsives et gérer des parcours de connexion ou de paiement. Elle détecte automatiquement les serveurs de développement, s’appuie sur un exécuteur universel et vous aide à lancer des tâches Playwright fiables avec moins de configuration et d’hésitation.

Browser Automation

Favoris 0GitHub 0

browser-use

par browser-use

browser-use est une skill d’automatisation de navigateur qui permet d’ouvrir des pages, d’inspecter l’état, de cliquer sur des éléments indexés, de saisir du texte dans des champs, de prendre des captures d’écran et de réutiliser une session de navigateur persistante. Utilisez-la pour le remplissage fiable de formulaires, la navigation et les workflows en mode connecté avec la CLI browser-use.

Browser Automation

Favoris 0GitHub 84.9k

browser-testing-with-devtools

par addyosmani

browser-testing-with-devtools aide les agents à tester et déboguer le comportement réel d’un navigateur via Chrome DevTools MCP. Utilisez-le pour inspecter le DOM, capturer les erreurs de console, analyser les requêtes réseau, profiler les performances et vérifier les correctifs dans un navigateur en direct.

Test Automation

Favoris 0GitHub 18.7k

baoyu-post-to-x

par JimLiu

baoyu-post-to-x automatise la publication sur X avec Chrome réel et CDP. Publiez du texte, des images, des vidéos, des citations et des articles X basés sur Markdown via des scripts bun, un mode aperçu et une exécution dans le navigateur.

Social Media

Favoris 0GitHub 13.2k

use-my-browser

par xixu-me

use-my-browser est une skill de stratégie d’automatisation du navigateur qui aide à choisir la bonne couche web : outils web publics, Chrome en direct, `raw fetch` ou Playwright pour les tâches connectées, dynamiques et pilotées via DevTools.

Browser Automation

Favoris 0GitHub 6

transloadit

par transloadit

Le skill transloadit est le point d’entrée des workflows Transloadit. Utilisez-le pour orienter les requêtes vers les docs, transform ou integrate, avec des নির্দেশances claires d’installation et d’utilisation pour l’automatisation des workflows et une exécution déterministe via CLI.

Workflow Automation

Favoris 0GitHub 0

playwright-cli

par VoltAgent

playwright-cli est une compétence d’automatisation de navigateur pour Playwright en ligne de commande. Elle aide à ouvrir des pages, inspecter des éléments, cliquer dans des parcours, remplir des formulaires, capturer des captures d’écran, simuler des requêtes et générer du code de test à partir d’interactions réelles. Utilisez-la pour une automatisation de navigateur reproductible et des tests UI.

Browser Automation

Favoris 0GitHub 8.5k

windows-vm

par obra

Utilisez le skill windows-vm pour créer, gérer et vous connecter en SSH à une VM Windows 11 sans interface dans Docker avec accélération KVM. Il convient à l’automatisation de poste de travail, à la configuration d’applications Windows et aux workflows d’agent répétables lorsque vous avez besoin d’un vrai environnement Windows sans RDP manuel.

Desktop Automation

Favoris 0GitHub 323

notebooklm

par PleasePrompto

Utilisez le skill notebooklm pour interroger des notebooks Google NotebookLM depuis Claude Code et obtenir des réponses appuyées par des sources et des citations. Conçu pour les usages NotebookLM dans des workflows centrés sur les documents, avec automatisation du navigateur, authentification persistante et gestion de notebooks pour les tâches de guide NotebookLM et d’automatisation de workflow.

Workflow Automation

Favoris 0GitHub 0