benchmark

作者 affaan-m

使用 benchmark 技能來量測效能基準、在 PR 前後偵測回歸，並比較頁面、API 與建置之間的技術棧替代方案，協助進行 Performance Optimization。

Stars156.1k

評論0

加入時間2026年4月15日

分類性能优化

安裝指令

npx skills add affaan-m/everything-claude-code --skill benchmark

編輯評分

這個技能的評分是 67/100，代表可以列入目錄供使用者參考，但在實作上仍有明顯缺口。倉庫已足夠清楚說明何時該使用 benchmarking，以及要在頁面、API 與建置效能上量測哪些指標，因此代理程式多半能正確觸發。不過，使用者應預期需要自行提供工具選擇、命令與報表流程，因為這個技能比較像一套量測框架，而不是完整可直接執行的操作配方。

67/100

亮點

觸發條件明確："When to Use" 章節清楚界定了 PR 前後檢查、建立基準、排查變慢、上線準備與技術棧比較等情境。
benchmarking 覆蓋完整：它列出了頁面效能、API，以及建置／開發迴圈效能的具體指標，包括 Core Web Vitals 與延遲百分位數。
對代理程式很有幫助：編號式量測步驟與目標門檻，提供了比泛用效能評估提示更明確的結構。

注意事項

操作層面的清晰度有限：技能提到 browser MCP 與 benchmarking 模式，但沒有提供安裝命令、支援檔案或可直接執行測試的具體命令範例。
信任與採用深度普通：沒有腳本、參考資料、資源或配套素材可證明可重複的工作流程或範例輸出。

Claude Code Metrics Performance 测试 API 浏览器自动化

總覽

基準測試 skill 概覽

benchmark skill 的用途

benchmark skill 可協助你建立效能基準、找出回歸，並用可重複的流程比較不同方案，而不是臨時性地東看西看。它是為了在 benchmark for Performance Optimization 情境下使用，適用於網頁、API、建置流程，以及變更前後的比較。

適合安裝這個 benchmark skill 的對象

這個 benchmark skill 特別適合工程師、技術主管，以及需要證據來判斷「是不是變慢了？」或「這個 PR 有沒有提升效能？」的 AI 輔助開發者。當你在上線前、使用者抱怨之後，或評估技術棧變動時，需要一套共同的量測方法，它尤其有用。

相較於一般提示詞，benchmark skill 的價值

一般提示詞可能只會叫代理程式「檢查效能」。這個 skill 更好，因為它提供了具體的基準測試框架：像是 Core Web Vitals 和頁面重量這類頁面指標、API 延遲百分位數與併發檢查，以及建置與測試耗時這類開發迴圈指標。這種結構能減少猜測，也讓輸出更容易長期比較。

如何使用 benchmark skill

安裝情境與先看什麼

進行 benchmark install 時，先從包含 skills/benchmark 的 repo 安裝這個 skill，然後先打開 SKILL.md。在這個案例中，skill 是自包含的，所以大部分可直接使用的指引都在那個檔案裡。建議依照以下順序閱讀：

SKILL.md
“When to Use” 區段
與你的任務相符的模式：page、API、build，或 before/after comparison

benchmark skill 需要哪些輸入

要把 benchmark 用得好，關鍵在於提供真實的目標與成功標準。實用的輸入包含：

目標 URL 或 API endpoint
環境：local、staging、preview、production
測試中的變更：branch、PR、commit，或 stack 選項
預期目標：LCP、INP、p95 latency、build time、bundle size
測試限制：auth、seed data、region、device 假設

較弱的提問是：「幫我 benchmark 我的 app。」
更強的提問是：「對這 3 個 staging URL 使用 benchmark skill，收集 LCP/CLS/INP、頁面重量和 request 數，然後和 production 比較，標出超過 10% 的回歸。」

把粗略目標改寫成更強的 benchmark 提示詞

benchmark 指南可以用這種提示詞模板：

範圍： page、API、build，或 before/after
目標： 精確的 URL、endpoint、命令或 branch
指標： 要量測什麼，以及門檻是多少
比較： baseline vs candidate
輸出： 摘要表、回歸、可能原因、下一步行動

範例：
「請使用 benchmark skill 比較這個 PR branch 和 main。針對頁面效能，測試 preview deployment 上的 /、/pricing 和 /checkout。回報 LCP、FCP、CLS、INP、TTFB、總頁面重量、JS 重量，以及 request 數。請標出超過 5% 的回歸，並提出前三項修正建議。」

能提升輸出品質的實務流程

高訊號的 benchmark usage 流程是：

一開始先只選一種模式。
在穩定環境建立 baseline。
用變更後的版本跑相同 benchmark。
要求比較表與回歸摘要。
最後才要求診斷與最佳化建議。

這個順序很重要。如果你跳過 baseline，代理程式可能會產生看起來合理、但可信度不高的建議。如果結果波動很大，就縮小範圍，只測更少的目標，並在更受控的條件下重複測試。

benchmark skill FAQ

benchmark skill 適合頁面、API，還是建置？

三者都適用。這個 skill 明確涵蓋頁面效能、API 效能，以及建置／開發迴圈效能。這讓它比只看 Lighthouse 的流程更廣，也更適合效能問題同時出現在前端、後端與工具鏈時使用。

什麼時候該用 benchmark，而不是一般效能提示詞？

當你需要可重複的量測、變更前後比較，或偵測回歸時，就該用 benchmark。一般提示詞適合腦力激盪最佳化想法，但這個 skill 更適合真正的工作重點是量測，而不是意見判斷的情境。

benchmark skill 適合新手嗎？

適合，只要你能提供清楚的目標即可。你不必事先知道每一個指標，但你應該知道要 benchmark 什麼，以及在哪裡 benchmark。新手最容易從單一頁面或單一 endpoint 開始，等第一次執行結果看得懂之後再擴大範圍。

什麼情況下不太適合？

如果你只是想了解一般效能概念，而不是要做量測，那就先別用這個 benchmark skill。當你的環境太不穩定，無法比較不同執行結果，或你無法提供可存取的 URL、可呼叫的 endpoint，或可執行的建置命令時，它也不是很適合。

如何改善 benchmark skill

提供更乾淨的輸入，讓 benchmark 結果更好

最有效的改善方式就是提升輸入品質。對於 benchmark for Performance Optimization，請明確指定：

精確的目標
production 或 staging 環境
baseline 與 candidate 版本
對團隊重要的門檻
任何必要的 auth／設定

「幫我們 benchmark API」太模糊。
「在 staging 上對 POST /search 和 GET /products/:id 做 100 次請求、10 個併發，並對照我們 300ms 的 p95 SLA 回報 p50/p95/p99」就很可執行。

避開常見的 benchmark 失敗模式

常見問題包括：

在不同環境之間做比較
把多個變更混在同一次測試裡
使用不具代表性的頁面或 endpoint
還沒量測就先要求診斷
沒有定義可接受的回歸門檻

這些失誤會讓 benchmark 輸出雜訊變大，也更難信任。先把測試設定控制好，再來解讀結果。

要求比較，不要只看單一數字

單一指標截圖不如相對變化有用。你可以透過以下要求，改善 benchmark skill 的輸出：

baseline vs candidate 表格
百分比變化
是否通過門檻
只針對前幾個回歸項目推測原因

這會把代理程式從單純倒資料，推進到能支援決策的層次。

第一次 benchmark 跑完後要持續迭代

第一次跑完後，請收斂範圍。可以要求代理程式只重跑最慢的頁面、最差的 API 百分位數，或最重的 build 步驟。接著再提出更聚焦的後續問題，例如「請專注於 render-blocking assets」或「調查為什麼 p99 遠比 p50 差」。這種迭代式流程正是 benchmark guide 最有價值的地方，因為它能把一次廣泛的量測，轉成實際可執行的最佳化計畫。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

vercel-react-best-practices

作者 vercel-labs

vercel-react-best-practices 是 Vercel Engineering 推出的 skill，用優先級規則引導 AI agent 優化 React 與 Next.js 效能，聚焦 waterfall、bundle size 與 rendering。

前端开发

收藏 0GitHub 24k

performance-optimization

作者 addyosmani

performance-optimization 技能可協助你先量測、找出真正瓶頸、修正問題，並驗證成效。當有效能需求、懷疑出現回歸，或需要改善 Core Web Vitals、載入時間或互動延遲時，這項技能特別適合使用。

性能优化

收藏 0GitHub 18.7k

supabase-postgres-best-practices

作者 supabase

supabase-postgres-best-practices 是一個用於 Supabase Postgres 最佳化的技能，涵蓋查詢調校、索引、綱要設計、RLS 效能、鎖定與連線管理。

資料庫工程

收藏 0GitHub 1.7k

wp-performance

作者 WordPress

使用 wp-performance 從後端調查並改善 WordPress 效能，不需要瀏覽器介面。它支援先量測、後診斷的流程，適用於緩慢的前台請求、管理後台頁面、REST 路由與 WP-Cron，並提供 WP-CLI profile/doctor、透過 REST header 使用 Query Monitor、Server-Timing、資料庫查詢、autoloaded options、物件快取、cron 與遠端 HTTP 呼叫等指引。

性能优化

收藏 0GitHub 1.4k

web-perf

作者 cloudflare

web-perf 透過 Chrome DevTools MCP 分析網站效能。它會衡量 Core Web Vitals、以 trace 為基礎的載入問題、阻擋渲染的資源、版面位移、快取問題與可及性缺口。若你需要 Performance Optimization、除錯緩慢頁面，或依據最新文件與即時 traces 進行的 web-perf 指南式工作流程，都適合使用 web-perf skill。

性能优化

收藏 0GitHub 1.3k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份實用的 React Native 效能優化指南，涵蓋啟動緩慢、掉幀、重繪過重、記憶體洩漏、bundle 膨脹與動畫卡頓等問題。當你需要針對 Hermes、bridge overhead、FlashList、原生模組，或排查 release regression 時，它能提供有依據的修正方向。

性能优化

收藏 0GitHub 1.3k

swift-nio

作者 Joannis

swift-nio 是一個用於 SwiftNIO 後端開發的技能，涵蓋 server、client、pipeline、buffer、codec，以及 event-loop 安全的 async 程式碼。可用來處理 swift-nio 使用問題、protocol parsing、TCP/UDP 服務、NIOAsyncChannel 整合，以及排查 EventLoop 上的 blocking work。這是一份實用的 swift-nio 指南，著重正確的架構與實作方式。

後端开发

收藏 0GitHub 0

audit-website

作者 squirrelscan

audit-website skill 透過 squirrel CLI，依據 230+ 項規則稽核網站與 Web App，涵蓋 SEO、技術、內容、效能、安全性、連結與網站健康度，並回傳可直接供 LLM 使用、具體可執行的報告。

UX 稽核

收藏 0GitHub 68

autoresearch

作者 github

autoresearch 是一套用於程式開發任務的自主實驗迴圈，特別適合有可量化成果的情境。它會協助開發者先定義目標、基準、衡量指標與範圍，再透過以 git 檢查點為基礎的流程，反覆進行程式碼修改、測試，以及保留或還原變更的判斷。

工作流自動化

收藏 0GitHub 0

godot-gdscript-patterns

作者 wshobson

godot-gdscript-patterns 可協助 Godot 4 使用者產生與檢視更完善的 GDScript，涵蓋場景結構、signals、state machines、autoloads 與 async loading 等常見模式。適合用來把經驗驗證過的 Godot 架構導入遊戲系統、UI 流程與較易維護的專案程式碼。

前端开发

收藏 0GitHub 32.5k

pytorch-patterns

作者 affaan-m

pytorch-patterns 可協助你以裝置無關的模式、可重現的實驗，以及明確的 tensor 處理來撰寫、審閱與除錯 PyTorch 程式碼。這個 pytorch-patterns 技能適合用來打造更乾淨的訓練迴圈、重構模型，以及取得實用的 PyTorch 指引。

程式碼编辑

收藏 0GitHub 156.2k

nextjs-turbopack

作者 affaan-m

nextjs-turbopack 技能可協助你在 Next.js 16+ 中使用 Turbopack，以提升本機開發速度、HMR 與打包器決策效率。它可作為實用的 nextjs-turbopack 指南，涵蓋安裝、使用，以及在 Frontend Development 工作流程中何時切回 webpack。

前端开发

收藏 0GitHub 156.2k

jpa-patterns

作者 affaan-m

jpa-patterns 是一份實用的 JPA/Hibernate 指南，適用於 Spring Boot 後端開發。內容涵蓋 entity 設計、關聯關係、查詢調校、交易、稽核、分頁與 pooling，協助減少 ORM 常見錯誤並提升 persistence 效能。

後端开发

收藏 0GitHub 156.2k

rust-async-patterns

作者 wshobson

rust-async-patterns 是一項實用的 Tokio 非同步 Rust 技能，涵蓋 tasks、channels、streams、timeouts、cancellation、tracing 與 error handling，適合後端開發使用。

後端开发

收藏 0GitHub 32.6k

go-concurrency-patterns

作者 wshobson

go-concurrency-patterns 協助你以符合 Go 慣用法的方式運用並行模式，涵蓋 worker pools、pipelines、channels、sync primitives，以及以 context 為基礎的 cancellation。你可以依據 SKILL.md 的指引，用它來設計更安全的後端服務、排查 race conditions，並改善 graceful shutdown 的行為。

後端开发

收藏 0GitHub 32.6k

async-python-patterns

作者 wshobson

async-python-patterns 是一份實用指南，協助你為以 I/O 為主的 Python 系統選擇安全的 asyncio 模式。可用來掌握安裝與採用情境、檢視使用方式、避免阻塞 event loop，並在設計 async API、workers、scrapers 與後端服務時，妥善處理有限並發、取消機制，以及 sync 與 async 之間的取捨。

後端开发

收藏 0GitHub 32.6k