browse

作者 garrytan

browse 是一款快速的无头浏览器 skill，适用于 QA、自用验证（dogfooding）和 browser automation。可用它打开页面、与元素交互、验证状态、对比操作前后变化、截取截图，并检查响应式布局、表单、上传、对话框和元素状态。需要浏览器证据而不是通用提示词时，安装 browse。

Stars91.8k

收录时间2026年5月9日

分类浏览器自动化

安装命令

npx skills add garrytan/gstack --skill browse

编辑评分

该 skill 评分为 78/100，属于目录中很合适的候选项，适合需要快速无头浏览器工作流来做 QA、自用验证、截图和状态验证的用户。仓库中包含足够真实的运行内容，智能体大概率可以更少靠猜测地触发并使用它，而不是停留在泛化提示词层面；但由于缺少安装命令说明，且存在少量占位标记，首次接入时仍可能有一定上手阻力。

78/100

亮点

SKILL.md 里有明确的触发语和使用场景："browse a page"、"headless browser"、"take page screenshot"，以及 QA 测试、发布验证和 bug 证据收集。
skill 正文篇幅较大，工作流内容丰富，包含许多关于范围、流程、约束和实践步骤的标题与信号，说明它更像真实可执行的操作指南，而不是空壳。
配套代码和脚本表明这是一个可运行的浏览器 skill 系统，包括客户端/服务端集成、活动/审计日志，以及用于 Node 兼容性的构建脚本。

注意点

SKILL.md 片段中能看到占位标记，但没有安装命令，因此首次配置可能需要额外浏览仓库来查找。
说明虽然覆盖面广，但目录层面的证据里没有简明的快速开始或参考文档；对于希望立刻获得执行把握的用户来说，这可能会拖慢智能体采纳速度。

测试 Screenshots Responsive Design 表单 JavaScript TypeScript Playwright

概览

browse skill 概览

browse skill 是做什么的

browse skill 是一款快速的无头浏览器工具，适用于 QA、dogfooding 和 browser automation。它面向的是这类场景：你需要打开页面、与页面交互、验证状态、对比操作前后变化，或采集截图、元素状态检查这类证据。如果你的任务是“在浏览器里测试这个流程，然后告诉我发生了什么”，browse skill 就很合适。

谁应该安装它

如果你经常验证网页、demo、表单、响应式布局、上传、弹窗，或做部署检查，就应该安装 browse skill。它尤其适合需要用截图或状态断言来证明 UI 行为、而不是只靠通用提示词的 agent。对于纯后端任务，或者只需要简单读页的场景，它就没那么有用。

browse skill 有什么不同

browse skill 的核心是实际执行浏览器，而不只是做基于文本的页面检查。这个 repo 明确支持命令路由、浏览器管理、CDP bridging、网络抓取、cookie 处理，以及带标注的视觉检查。这意味着 browse skill 面向的是带证据的实用 browser automation，而不是一个轻量级的“帮我总结这个网站”的工具。

如何使用 browse skill

正确安装 browse skill

请使用 skill 文档里给出的安装路径，或你的 skill manager 的添加命令，然后确认这个 skill 已经能在本地 skill 目录中被发现。repo 里包含像 bin/find-browse 这样的辅助 shim，这说明 browse skill 预期是通过支持 workspace 感知的安装方式来定位和调用的。如果二进制文件缺失，优先修复方法通常是执行 skill 的 setup/build 流程，而不是改写提示词。

给 browse 一个明确任务，不要只给模糊目标

高质量的 browse 使用，起点是一个明确的浏览器任务：URL、操作、预期结果，以及你希望返回的证据。好的输入例如：“打开登录页，提交有效凭据，确认跳转到 /dashboard，并返回一张截图和任何 console 或 network 错误。” 像“测试一下这个网站”这种输入，会留下太多路由歧义。

先读这些文件

在做安装和使用决策时，先看 SKILL.md，再查看 PLAN-snapshot-dropdown-interactive.md 了解已知的工作流约束，查看 SKILL.md.tmpl 了解这个 skill 是如何生成的，以及查看 bin/find-browse 和 bin/remote-slug 了解路径和 repo 解析行为。如果你在评估 browser automation 适配度，也建议顺手浏览 src/browser-manager.ts、src/cdp-bridge.ts 和 src/browser-skill-commands.ts，这样能更清楚这个 skill 到底能执行什么。

在工作流中使用 browse skill

一个可靠的 browse 工作流是：先定义你想要的页面状态，再执行浏览器操作，接着验证输出，然后再迭代下一条约束。例如，提前指定响应式宽度、表单输入或预期的 DOM 变化，这样 browse 就能一次性检查到位。这样可以减少来回沟通，让第一次运行比泛泛的提示词更有用。

browse skill 常见问题

browse skill 只适合截图吗？

不是。截图只是输出形式之一。这个 skill 还用于导航、交互、状态验证、响应式检查、表单测试、上传以及 bug 证据收集。如果你的真实需求是“证明这个 browser 行为”，browse skill 比只做截图的工具更完整。

browse skill 和普通提示词有什么不同？

普通提示词是让 agent 自己推理浏览器任务。browse skill 则给了 agent 一条面向浏览器的执行路径，包括命令路由和浏览器状态检查。通常这意味着更少的猜测、更好的可重复性，以及当流程失败时更清晰的证据。

browse skill 适合新手吗？

适合，只要你能清楚描述一个浏览器任务。新手最容易成功的方式，是提供一个 URL、一个操作、一个预期结果，以及一个证据需求。如果你本来就会写测试用例，通常第一次就能把 browse skill 用起来。

什么时候不该用 browse skill？

如果你只需要静态内容提取、repo 检查，或一个普通的编程答案，就不该用 browse skill。它也不适合你无法明确浏览器目标，或者任务根本不需要真实渲染页面的情况。这些场景下，普通 agent 提示词更简单。

如何提升 browse skill

提供更强的浏览器输入

browse skill 的最佳结果，来自于明确写出页面、用户操作、成功条件，以及你希望返回的产物。例如：“在定价页切换到年付，确认总价更新，并截取最终状态的截图。” 这比“检查价格”更好，因为它消除了对“成功”到底意味着什么的歧义。

留意常见失败模式

browse skill 最常见的失败是信息不充分：缺 URL、缺状态、缺预期结果。第二类问题，是想要视觉证明，却没说清楚页面哪一部分重要。如果任务包含表单、菜单、弹窗或动态内容，请明确写出来；这些细节会实质影响 browse skill 的使用方式。

在第一次运行后继续迭代

如果第一次结果已经接近但还不完整，就用准确的偏差来调整下一轮提示：是 viewport 不对、漏了元素、状态过旧，还是缺少 network 证据。browse skill 的价值，在于每一轮都能缩小不确定性。要基于输出补充约束，而不是把同一个请求重复一遍。

为 Browser Automation 调优 browse

做 browser automation 时，要加入具体的测试条件：测试账号类型、设备尺寸、locale，以及 cookies 或登录状态是否重要。如果你是在验证 bug，请把复现步骤和预期/实际差异写进去。这样 browse skill 才更像一个 browser automation assistant，而不是普通的 QA 记录工具，而且通常能在第一轮就产出更好的证据。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

playwright-interactive

作者 openai

playwright-interactive 是一项浏览器自动化技能，适用于本地 Web 和 Electron 应用中的持久 Playwright 会话。它可用于检查 UI 状态、重试交互，以及在不重启工具链的情况下执行功能或视觉 QA。非常适合需要一份实用的 playwright-interactive 迭代调试指南的场景。

浏览器自动化

收藏 0GitHub 0

playwright-skill

作者 testdino-hq

playwright-skill 是一份面向 Playwright 的可靠浏览器自动化指南。它帮助团队编写、调试并扩展 E2E 流程、API 检查、组件测试、视觉回归、可访问性、认证、CI/CD，以及从 Cypress 或 Selenium 迁移的测试。需要的不是泛泛的测试建议，而是可直接落地的实践模式时，就用 playwright-skill。

测试自动化

收藏 0GitHub 0

data-scraper-agent

作者 affaan-m

data-scraper-agent 可帮助你搭建可重复使用的公开数据管道，用于网页抓取、数据丰富和存储。它面向按计划持续监控任务、价格、新闻、仓库、体育和列表信息，可结合 GitHub Actions 定时运行，并将结果输出到 Notion、Sheets 或 Supabase。更适合长期跟踪，不适合一次性提取。

网页抓取

收藏 0GitHub 156.1k

playwright-best-practices

作者 currents-dev

playwright-best-practices 是一项面向 Playwright + TypeScript 的技能，聚焦编写稳定测试、减少 flaky 问题、优化认证流程、判断 fixtures 与 page objects 的取舍，并基于仓库中的实战指导覆盖 CI、popups、mobile、iframes、websockets 和多用户场景。

测试自动化

收藏 0GitHub 174

x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 通过 Xquik 获取 X（Twitter）数据和需要确认的操作。它支持推文搜索、用户查询、粉丝提取、媒体下载、监控、webhook、MCP 和写入操作。适合基于 API key 的网页抓取式研究，不适合使用 X 登录凭证。

网页抓取

收藏 0GitHub 71

composio

作者 ComposioHQ

使用 composio 通过 CLI 或 SDK 将 AI 工作流连接到外部应用。这个 composio 技能面向工作流自动化、应用操作、按用户连接、工具包发现，并在开始构建前提供一份实用的安装与使用指南。

工作流自动化

收藏 0GitHub 48

playwright-skill

作者 lackeyjb

playwright-skill 是一个浏览器自动化 skill，适合用于测试页面、填写表单、检查链接、截图、验证响应式布局，以及处理登录或结账流程。它能自动检测开发服务器，使用通用执行器，并帮助你以更少的配置和猜测运行可靠的 Playwright 任务。

浏览器自动化

收藏 0GitHub 0

browser-use

作者 browser-use

browser-use 是一项用于浏览器自动化的技能，可用于打开页面、检查当前状态、点击带索引的元素、在输入框中键入内容、截取截图，并复用持久化浏览器会话。通过 browser-use CLI，它适合完成稳定的表单填写、页面导航以及需要登录状态的工作流。

浏览器自动化

收藏 0GitHub 84.9k

browser-testing-with-devtools

作者 addyosmani

browser-testing-with-devtools 可让智能体通过 Chrome DevTools MCP 测试并调试真实浏览器中的行为。你可以用它检查 DOM、捕获 console 报错、分析网络请求、进行性能分析，并在真实浏览器环境中验证修复是否生效。

测试自动化

收藏 0GitHub 18.7k

baoyu-post-to-x

作者 JimLiu

baoyu-post-to-x 通过真实 Chrome 和 CDP 自动发布到 X。可借助 bun 脚本、预览模式和基于浏览器的执行流程，发布文本、图片、视频、引用帖，以及基于 Markdown 的 X Articles。

社交媒体

收藏 0GitHub 13.2k

use-my-browser

作者 xixu-me

use-my-browser 是一项浏览器自动化策略技能，用于帮助你在不同网页层之间做出合适选择：公共 Web 工具、实时 Chrome、raw fetch，或 Playwright，以应对登录态页面、动态站点以及依赖 DevTools 的任务。

浏览器自动化

收藏 0GitHub 6

playwright-cli

作者 VoltAgent

playwright-cli 是一个通过命令行使用 Playwright 进行浏览器自动化的技能。它可用于打开页面、检查元素、按流程点击、填写表单、截取截图、模拟请求，以及根据真实交互生成测试代码。适合需要可重复执行的浏览器自动化和 UI 测试场景。

浏览器自动化

收藏 0GitHub 8.5k

windows-vm

作者 obra

使用 windows-vm 技能在 Docker 中借助 KVM 加速创建、管理并通过 SSH 连接到无头的 Windows 11 虚拟机。它适合桌面自动化、Windows 应用安装，以及需要真实 Windows 环境但不想手动使用 RDP 的可重复 agent 工作流。

桌面自动化

收藏 0GitHub 323

notebooklm

作者 PleasePrompto

使用 notebooklm 技能，从 Claude Code 直接查询 Google NotebookLM 笔记本，获得有来源依据、带引用的答案。它面向以文档为先的 notebooklm 使用场景，支持浏览器自动化、持久化认证和笔记本管理，适合 NotebookLM 指南与工作流自动化任务。

工作流自动化

收藏 0GitHub 0

playwright

作者 openai

使用 playwright skill 通过终端和一个包装脚本、`playwright-cli` 来自动化真实浏览器。它适合导航、表单填写、截图、快照、内容提取和 UI 流调试等浏览器自动化任务。先检查 `npx`，安装该 skill，设置 `PWCLI`，然后按 CLI 优先的工作流执行。

浏览器自动化

收藏 0GitHub 0

canary-watch

作者 affaan-m

canary-watch 是一款发布后监控技能，用于在上线、合并或依赖更新后，对线上 URL 进行回归检查，适用于 staging 或 production 场景。

监控

收藏 0GitHub 156.1k