benchmark

作者 garrytan

benchmark 技能可帮助发现 Web 和 App 工作流中的性能回退。可用它建立基线，对比改动前后，并跟踪某个 PR 是否让页面更慢、更重或更不稳定。它是一份面向性能优化的实用 benchmark 指南，覆盖 Core Web Vitals、Lighthouse 检查、bundle 大小和加载时间趋势。

Stars91.8k

收录时间2026年5月9日

分类性能优化

安装命令

npx skills add garrytan/gstack --skill benchmark

编辑评分

该技能评分为 67/100，说明它可以进入目录，但需要明确说明限制：它看起来确实是面向性能回归基准测试的工作流型技能，不过由于缺少配套资源，且存在一些占位标记，安装决策的把握度会打折。需要自动化页面速度回归检查的用户可以考虑；如果更看重非常完善、开箱即用的安装体验，可能还需要先补充更多文档。

67/100

亮点

用途明确且可执行：用于检测页面加载时间、Core Web Vitals 和资源体积方面的性能回退。
触发意图清晰：有明确的使用场景和语音别名，如“speed test”和“check performance”，降低了理解成本。
SKILL.md 中包含较完整的工作流内容，带有多个标题和代码块步骤，说明它更像真实的操作指南，而不是空壳。

注意点

没有安装命令，也没有配套的脚本、引用或资源，因此采用时可能需要更多手动配置和检查。
存在占位标记，这会降低对工作流每个分支都已完全定稿的信任度。

Lighthouse Performance Web Vitals Bundle Size 浏览器自动化前端

概览

benchmark skill 概览

benchmark skill 的作用

benchmark skill 用于在 Web 和应用工作流中检测性能回归。它可以帮助你建立基线、对比变更前后结果，并跟踪某个 PR 是否让页面变慢、变重，或稳定性变差。实际使用中，benchmark skill 最适合回答一个问题：这次改动到底提升了性能，还是拖累了性能？

适合谁使用

如果你关注页面速度、Core Web Vitals、Lighthouse 风格检查、bundle 大小，或者加载时间的长期趋势，就适合用这个 benchmark skill。它很适合评审者、前端工程师，以及需要一套可重复方法来评估性能变化的 AI agents，而不是只凭截图或一次草率的手工测试来猜测。

它为什么不同

benchmark skill 不只是一个泛泛的“跑个测试”的提示词。它围绕前后对比、回归检测和持续趋势感知来设计，并且配套的工作流指导更贴近基于浏览器的性能测量。这让它比那种只会问“有没有速度问题”的一次性提示词，更适合 Performance Optimization。

如何使用 benchmark skill

benchmark 的安装与设置

在 Claude skills 环境中，使用仓库提供的 skill 命令安装 benchmark skill，然后在真实任务中使用前先打开 skill 文件。预期的安装命令是：
npx skills add garrytan/gstack --skill benchmark

安装完成后，确认当前 workspace 中已经可用这个 skill，并且你的任务足够具体，能够被测量。benchmark skill 最适合在测试仓库、目标页面或路由，以及待评估变更都已经明确的情况下使用。

先读什么

先看 SKILL.md，如果你想了解生成后的结构，再检查 SKILL.md.tmpl。因为这个仓库没有为该 skill 暴露额外的 rules/、resources/ 或辅助脚本，所以 skill 文件本身就是主要事实来源。若要做使用决策，最重要的是前言、plan-mode 指导，以及任何会影响 benchmark skill 何时运行的路由或约束说明。

如何写出更好的提示词

弱提示词只会说“检查性能”。更好的 benchmark 使用提示词会明确目标、基线和你需要做出的决策：

“对比 /pricing 在图片压缩改动前后的表现，并报告 LCP、CLS 和总传输大小是否有回退。”
“在 mobile emulation 下 benchmark checkout 页面，并告诉我新的 bundle 拆分是否改善了加载时间。”
“为首页执行 performance benchmark，并总结这个 PR 是否可以安全合并。”

要把页面、设备假设，以及什么算失败都写清楚。这样可以减少歧义，让结果更可执行。

能产出有用结果的工作流

把 benchmark 指南当成一个可重复的闭环：先确定页面，建立基线，运行对比，然后结合你做的改动解读差异。如果你在 plan mode 下工作，要先确认这个 skill 只是负责检查，还是也要执行测量。为了得到更好的输出，尽量缩小测试范围；通常一个关键路由，比全站扫一遍更有价值。

benchmark skill 常见问题

benchmark skill 只适合 Web 性能吗？

它主要面向浏览器可见的性能优化，尤其是页面、路由和前端改动。如果你的任务是后端延迟、基础设施 profiling 或数据库调优，除非目标是用户侧页面指标，否则 benchmark skill 可能不是最优先的选择。

我需要完整提示词吗，还是 skill 自己就够了？

这个 skill 能帮你把工作结构化，但仍然需要一个具体目标。泛化提示词也许能触发 benchmark skill，但当你提供了路由、变更内容和对比点时，benchmark 的使用效果会更好。你的请求越具体，agent 需要自行推断的内容就越少。

benchmark 适合新手吗？

适合，尤其是当你想用一种有引导的方法来检查某次改动是否让性能变差时。它比从零自己搭建评估清单更容易上手，但你仍然需要知道想测量的是哪个页面或功能。

什么时候不该用它？

当你只需要定性的 UI review、页面太不稳定而无法得到有意义的测量结果，或者你的主要问题根本不是性能时，就不要用 benchmark skill。如果你无法定义稳定的前后对比，benchmark 的结果就会很噪。

如何改进 benchmark skill

给 skill 一个可测量的目标

提升效果最大的方式，是明确指定要 benchmark 什么，以及成功长什么样。说清楚哪个 URL、哪类设备和哪个指标最重要。对于 Performance Optimization 来说，这通常意味着只指定一个主要指标，比如 LCP 或 bundle 大小，而不是泛泛地要求“找出所有性能问题”。

把正在测试的改动写进去

当 skill 知道改动内容时，benchmark 才最有价值：是新的图片处理链路、代码拆分重构、字体替换，还是移除了第三方脚本。这个上下文有助于把正常波动和真实回归区分开，也能让输出更值得信任。

直接要求你会据此行动的对比结果

如果你需要的是合并决策，就直接说。如果你还需要修复建议，也要明确说明。实用的后续提示词包括：

“对比最近一次稳定构建，并标记任何超过 5% 的回退。”
“先 benchmark 这个分支，然后告诉我如果结果更差，最值得优先修的是什么。”
“重新在 mobile 和 desktop 上跑一遍检查，但优先看 LCP 最差的路由。”

在第一次结果基础上迭代

如果第一次结果噪声很大，先改输入再重跑：缩小路由范围、去掉无关改动，或者把测试条件定义得更严格一些。benchmark skill 最适合被当作一个用于决策支持的可重复 benchmark skill，而不是一次性就能诊断所有速度问题的万能工具。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

vercel-react-best-practices

作者 vercel-labs

vercel-react-best-practices 是由 Vercel Engineering 提供的 skill，用优先级规则引导 AI 优化 React 和 Next.js 性能，涵盖瀑布流请求、bundle 体积和渲染等关键问题。

前端开发

收藏 0GitHub 24k

performance-optimization

作者 addyosmani

performance-optimization 技能帮助你先测量、找出真正瓶颈、完成优化，并验证结果。适用于已有性能要求、怀疑出现性能回退，或需要改善 Core Web Vitals、加载时间与交互延迟的场景。

性能优化

收藏 0GitHub 18.7k

supabase-postgres-best-practices

作者 supabase

supabase-postgres-best-practices 是一项面向 Supabase Postgres 优化的技能，覆盖查询调优、索引、Schema 设计、RLS 性能、锁竞争与连接管理等核心主题。

数据库工程

收藏 0GitHub 1.7k

wp-performance

作者 WordPress

使用 wp-performance 从后端排查并提升 WordPress 性能，无需浏览器界面。它支持先测量、后诊断的方式，适用于前台请求缓慢、后台页面、REST 路由和 WP-Cron 等场景，并提供关于 WP-CLI profile/doctor、通过 REST 头查看 Query Monitor、Server-Timing、数据库查询、autoloaded options、对象缓存、cron 和远程 HTTP 调用的指导。

性能优化

收藏 0GitHub 1.4k

web-perf

作者 cloudflare

web-perf 使用 Chrome DevTools MCP 分析 Web 性能。它可衡量 Core Web Vitals、基于 trace 的加载问题、阻塞渲染的资源、布局偏移、缓存问题以及可访问性缺口。适合用于性能优化、慢页面排障，以及依赖最新文档和实时 trace 的基于证据的 web-perf 指南式工作流。

性能优化

收藏 0GitHub 1.3k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份实用的 React Native 性能优化指南，聚焦启动慢、掉帧、重渲染过重、内存泄漏、bundle 体积膨胀和动画卡顿等问题。适用于需要有证据支撑的修复方案，例如 Hermes、bridge 开销、FlashList、原生模块，或排查线上版本回归性能时使用。

性能优化

收藏 0GitHub 1.3k

swift-nio

作者 Joannis

swift-nio 是一项面向 SwiftNIO 后端开发的技能，涵盖 servers、clients、pipelines、buffers、codecs，以及 EventLoop 安全的异步代码。适用于 swift-nio 使用问题、协议解析、TCP/UDP 服务、NIOAsyncChannel 集成，以及排查 EventLoop 上的阻塞工作。它是一本面向正确架构与实现的实用 swift-nio 指南。

后端开发

收藏 0GitHub 0

audit-website

作者 squirrelscan

audit-website 技能通过 squirrel CLI，基于 230+ 条规则对网站和 Web 应用进行审计，覆盖 SEO、技术、内容、性能、安全、链接和站点健康等维度，并输出可直接供 LLM 使用的可执行报告。

UX 审计

收藏 0GitHub 68

autoresearch

作者 github

autoresearch 是一套面向编码任务的自主实验循环，适用于结果可衡量的场景。它帮助开发者先明确目标、基线、指标和范围，再借助由 git 检查点支撑的流程，在代码修改、测试以及保留或回退决策之间持续迭代。

工作流自动化

收藏 0GitHub 0

godot-gdscript-patterns

作者 wshobson

godot-gdscript-patterns 可帮助 Godot 4 用户生成和审查 GDScript，改进场景结构、signals、状态机、autoloads 和 async loading 模式。适合在玩法系统、UI 流程和可维护的项目代码中引入经过验证的 Godot 架构实践，便于安装后直接用于实际开发决策。

前端开发

收藏 0GitHub 32.5k

pytorch-patterns

作者 affaan-m

pytorch-patterns 帮助你使用与设备无关的模式、可复现实验和显式张量处理来编写、审查和调试 PyTorch 代码。将 pytorch-patterns 技能用于更干净的训练循环、模型重构以及实用的 PyTorch 指南。

代码编辑

收藏 0GitHub 156.2k

nextjs-turbopack

作者 affaan-m

nextjs-turbopack 技能可帮助你在 Next.js 16+ 中使用 Turbopack，以获得更快的本地开发、HMR 以及打包器决策参考。它适合作为一份实用的 nextjs-turbopack 指南，用于安装、使用，以及在 Frontend Development 工作流中判断何时切回 webpack。

前端开发

收藏 0GitHub 156.2k

jpa-patterns

作者 affaan-m

jpa-patterns 是一份面向 Spring Boot 后端开发的实用 JPA/Hibernate 指南，涵盖实体设计、关系映射、查询调优、事务、审计、分页和连接池，帮助减少 ORM 误用并提升持久化性能。

后端开发

收藏 0GitHub 156.2k

rust-async-patterns

作者 wshobson

rust-async-patterns 是一项面向 Tokio 异步 Rust 的实用技能，涵盖任务、通道、流、超时、取消、tracing 和错误处理，适合后端开发场景。

后端开发

收藏 0GitHub 32.6k

go-concurrency-patterns

作者 wshobson

go-concurrency-patterns 帮助你以符合 Go 习惯的方式运用并发模式，涵盖 worker pools、pipelines、channels、sync primitives 以及基于 context 的取消控制。你可以根据 SKILL.md 中的指导，用它来设计更稳健的后端服务、排查竞态条件，并改进优雅关闭行为。

后端开发

收藏 0GitHub 32.6k

async-python-patterns

作者 wshobson

async-python-patterns 是一份实用指南，帮助你为 I/O 密集型 Python 系统选择更安全的 asyncio 模式。可用于了解安装与使用背景、审查用法、避免阻塞事件循环，并在设计异步 API、worker、爬虫和后端服务时，更好地权衡有界并发、取消机制，以及同步与异步之间的取舍。

后端开发

收藏 0GitHub 32.6k