systematic-debugging

作者 obra

systematic-debugging 是一套以先找出根因為核心的除錯 skill，適合處理 bug、不穩定測試、建置失敗與各種非預期行為。你可以先了解它的四階段工作流程、配套檔案，以及在提出修正方案前何時應優先使用這個 skill。

Stars121.8k

評論0

加入時間2026年3月29日

分類调试

安裝指令

npx skills add obra/superpowers --skill systematic-debugging

編輯評分

這個 skill 評分為 84/100，代表它很適合收錄於目錄中，特別適合想導入可重複使用、且能讓 agent 穩定觸發的除錯流程的使用者。repo 提供了相當完整的工作流程內容、明確的判斷規則，以及實用的配套檔案，因此安裝與採用時，通常會比單純輸入一般「debug this」提示得到更多助益、也更少摸索。不過，它在封裝完整度與初次上手體驗上，仍有些細節稍顯粗糙。

84/100

亮點

觸發條件非常明確：說明與「When to Use」段落清楚指出，遇到 bug、測試失敗、效能問題、建置失敗與其他非預期行為時，就應啟用這個 skill。
實作導向且具體：此 skill 定義了必須遵循的四階段流程，並明訂「NO FIXES WITHOUT ROOT CAUSE INVESTIGATION FIRST」這類硬規則，相較一般除錯提示可大幅降低猜測空間。
附有可重複運用的配套材料與範例，包括 root-cause tracing、condition-based waiting、defense-in-depth validation，以及用來找出 polluter 的 shell script。

注意事項

部分支援檔案看起來較像內部範例／測試素材（例如 CREATION-LOG 與 test-* 文件），對第一次採用的使用者來說，整體套件體驗可能不算精簡。
SKILL.md 本身沒有提供安裝指令，因此使用者需要回到上層 repo 自行判斷採用與設定方式，無法只靠這個 skill 頁面完成安裝。

Superpowers Codex Cursor Copilot Windsurf OpenCode OpenClaw 测试工作流操作手册开发者受众

總覽

systematic-debugging skill 概覽

systematic-debugging skill 是一套有結構的除錯工作流程，適合想減少猜測式修補、加快找出根因的代理與開發者。它的核心原則很簡單：先調查，再改程式。也因此，它特別適合用在測試失敗、偶發不穩定行為、正式環境 bug、建置問題，以及那種「快速修一下」反而很容易把真正問題蓋掉的整合類故障。

這個 systematic-debugging skill 最適合誰

如果你有以下情況，適合用 systematic-debugging：

修了好幾次還是沒修好，或只能修到一半
在時間壓力下除錯
需要 AI 助手先慢下來做調查，而不是直接修表面症狀
想要一套可重複使用的流程來處理 bug、flaky tests 與非預期行為

特別是當問題看起來很明顯，但你其實還不知道它「為什麼會發生」時，這個 skill 很有用。

這個 skill 實際上幫你完成什麼工作

真正要完成的工作，不是「產出一個修補」。而是：

重現問題
追出原因
一次驗證一種解釋
最後才實作有針對性的修正

聽起來比較慢，但通常能明顯減少重工、失敗修補，以及因為瞎猜而引入的新 bug。

systematic-debugging 有什麼不同

一般的提示通常會從症狀直接跳到解法。systematic-debugging skill 明確反對這種做法。這個 repo 強調一種近乎「鐵律」的流程：在完成根因調查之前，不要先提修法。

周邊檔案也讓它比一般除錯清單更實用：

root-cause-tracing.md：當你看到的錯誤離真正來源很遠時很有幫助
condition-based-waiting.md：適合處理因為任意延遲而造成的 flaky async tests
defense-in-depth.md：幫你把一次性的驗證修補，提升成更有結構的預防機制
find-polluter.sh：用來隔離會洩漏檔案或狀態的測試

最適合的問題類型

systematic-debugging for Debugging 特別適合以下情況：

測試失敗，但你還無法解釋原因
CI 中的 flaky tests
之前修過，但修法沒有真正生效的 bug
錯誤訊息出現在很深的 call stack 裡
錯誤狀態、檔案殘留、路徑不對、race condition、時序問題

什麼情況下它不太適合

只有在任務本質上不是除錯時，才建議跳過它，例如：

很直接的功能開發
沒有失敗行為需要解釋的例行 refactor
純外觀或文案調整

即使如此，只要你處理的是「非預期行為」，systematic-debugging 通常仍然是更穩妥的起點。

如何使用 systematic-debugging skill

安裝 systematic-debugging 的方式

如果你是沿用這個生態系常見的 Skills CLI 模式，可用以下指令安裝：

npx skills add https://github.com/obra/superpowers --skill systematic-debugging

安裝後，你可以從 agent 環境直接呼叫它；或者進入 skill 資料夾，讀原始檔案並手動照它的流程操作。

先讀這些檔案

如果你想快速掌握高資訊密度的 systematic-debugging guide，建議依序閱讀：

skills/systematic-debugging/SKILL.md
skills/systematic-debugging/root-cause-tracing.md
skills/systematic-debugging/condition-based-waiting.md
skills/systematic-debugging/defense-in-depth.md
skills/systematic-debugging/find-polluter.sh

這樣排序的原因是：

SKILL.md 提供必須遵守的四階段流程
root-cause-tracing.md 適合處理症狀出現在下游很遠處的情況
condition-based-waiting.md 提供 flaky async tests 的具體修正模式
defense-in-depth.md 幫你把最終修法做得更穩
find-polluter.sh 是用來隔離測試污染的實用工具

這個 skill 需要你提供哪些輸入

systematic-debugging usage 的品質，非常依賴你提供的輸入。請盡量給出：

精確的錯誤訊息
stack trace
重現步驟
預期行為與實際行為
環境細節，例如 OS、runtime、test runner、只在 CI 發生或只在本機發生
最近的程式碼變更
問題是穩定可重現，還是偶發 flaky
你已經試過哪些做法

如果缺少這些資訊，模型就更容易開始靠猜。

把粗略的 bug 回報整理成有效 prompt

弱的 prompt：

Test is failing. Help fix it.

更好的 prompt：

Use systematic-debugging on this failing test. Do not propose a fix until root cause investigation is complete. Here is the exact error, stack trace, reproduction command, recent changes, and the one behavior difference between local and CI. Identify likely root causes, suggest the minimum investigation steps, and keep hypotheses separate.

這類 prompt 之所以更有效，是因為它要求先輸出調查結果，再進入實作。

一個實用的 prompt 模板

你可以用這個結構來做 systematic-debugging usage：

Issue：哪裡壞了
Reproduction：精確指令或重現步驟
Evidence：logs、trace、截圖、失敗 assertion
Scope：只在 local、只在 CI、某一台機器，還是所有環境
Recent changes：commits、dependency 升級、config 變更
Constraints：不能改 API、需要最小 patch、有 deadline 等
Request：先調查 root cause，再提出一個修法

範例：

Use systematic-debugging for this Jest failure. Repro: npm test src/foo.test.ts. Error: Timeout waiting for TOOL_RESULT event after 5000ms. It fails in CI and under parallel runs, not always locally. We recently changed thread event handling. First investigate root cause, then propose one focused fix and one validation plan.

依序遵守四階段 workflow

這個 repo 的核心是四個階段。實務上可這樣使用：

Root cause investigation
仔細讀錯誤、穩定重現、檢查最近改了什麼，並收集證據。
Pattern analysis
觀察是否有時序、環境、輸入型態、狀態洩漏，或 call-chain 相關模式。
Hypothesis testing
一次只建立一種解釋並驗證，不要同時改很多變數。
Implementation
只有在證據已支持某個原因之後，才實作修正並驗證。

如果第 1 階段做得不扎實，後面每一步都會變差。

如何用 systematic-debugging 處理 flaky tests

這個 repo 在這方面提供的協助比多數同類資源更落地。如果某個測試依賴 sleep、setTimeout 或任意等待時間，請直接看 condition-based-waiting.md 與 condition-based-waiting-example.ts。

關鍵轉換是：

壞模式：猜非同步工作大概要多久
更好的模式：等待能證明工作已完成的條件成立

這點很重要，因為很多看似「隨機」的失敗，實際上是被時序猜測掩蓋的 race condition。

當症狀出現在下游時，怎麼用 systematic-debugging

如果錯誤出現在很深的 stack 中，或離壞資料真正產生的位置很遠，就該用 root-cause-tracing.md。流程是：

找出直接失敗的那一行
往上追一層 caller
持續往上追，直到找到錯誤狀態第一次出現的位置
在來源處修，不要只在 crash 點補洞

這是 systematic-debugging skill 最有價值的部分之一，因為很多 bug 其實都是更早之前無效狀態的後續症狀。

如何使用 polluter finder

如果某些測試會留下檔案、資料夾或狀態，先看 find-polluter.sh，通常比自己臨時亂寫迴圈來得更有效。

使用模式：

./find-polluter.sh <file_or_dir_to_check> <test_pattern>

腳本中的範例：

./find-polluter.sh '.git' 'src/**/*.test.ts'

當失敗真正原因是隱性的測試污染，而不是表面上失敗的那個測試時，這個工具特別有用。

最容易得到好結果的常見 workflow

一個可靠的 systematic-debugging install 與首次使用流程如下：

安裝 skill
讀 SKILL.md
收集精確的失敗證據
先要求 agent 調查，不要修
選出證據最充分的假設
只驗證那一個假設
實作一個聚焦的修正
如果 bug 來自無效資料或多個入口路徑，再補上驗證或 defense-in-depth

這樣做可以避開最常見的失敗模式：還沒理解故障，就先改程式碼。

使用這個 skill 時不要做什麼

不要要求 systematic-debugging：

一開始就腦暴很多修法
還沒重現 bug 就大幅改寫一大片程式
不用解釋、只求「先讓測試過」
同時修補多個懷疑原因

這些捷徑都直接違反這個 skill 的設計，也會拉低輸出品質。

systematic-debugging skill 常見問題

systematic-debugging 只適合複雜 bug 嗎？

不是。這個 repo 的立場是：即使是簡單 bug，也一樣有根因。當問題看起來簡單到讓人想立刻打一個 quick patch 時，這個 skill 反而最有價值。

它和一般除錯 prompt 有什麼不同？

一般 prompt 往往鼓勵快速給答案，也比較容易接受推測式修補。systematic-debugging 會強迫模型把調查、假設與實作切開。通常這會帶來更少的錯誤 patch，以及更好的說明品質。

systematic-debugging 對新手友善嗎？

是的，前提是你能提供具體證據。流程雖然嚴格，但步驟其實不難理解：重現、檢查、追溯、一次驗證一個想法，最後才修。對新手來說，這甚至可能更有幫助，因為它能防止隨機試錯。

什麼時候不該用 systematic-debugging？

以下情況不適合把它當成主要模式：

功能發想
架構腦力激盪
和故障無關的程式碼生成
沒有壞掉行為需要解釋的純視覺調整

當你需要的是「找出原因」，而不只是「打一個 patch」時，再用它。

systematic-debugging 能幫忙處理只在 CI 發生的失敗嗎？

可以。它很適合處理只在 CI 出現、或對負載敏感的故障，因為它會推著你比較環境差異、重現觸發條件，並檢查時序與狀態假設，而不是直接猜。

它能處理 flaky async tests 嗎？

可以，而且這個 repo 在這點上表現比平均更強。condition-based-waiting.md 和範例 TypeScript 檔案，提供了非常具體的路徑，幫你從任意等待改成基於條件的同步。

這個 skill 有附工具，還是只有方法建議？

主要是流程指引，但也附了一些具體的輔助檔案。最實用的是 find-polluter.sh；另外，condition-based waiting 的範例也能直接套用到某些 TypeScript 測試設定中。

我可以把 systematic-debugging 用在任何技術棧嗎？

大致上可以。核心方法與技術棧無關。雖然範例偏向 TypeScript、shell 與測試工作流，但整套調查流程適用於多數語言與 framework。

如何改善 systematic-debugging skill 的使用效果

在要求修法之前，先提供更好的證據

影響最大的槓桿就是輸入品質。想得到更好的 systematic-debugging 結果，請盡量附上：

一個精確的重現指令
一段完整而精確的錯誤內容
一個最小失敗測試或檔案
最近改了什麼
這個問題是否每次都能重現

這樣能讓 skill 根據證據運作，而不是靠推論補空白。

先要求輸出調查結果，再進入實作

高品質 prompt 會明確阻止過早修補。例如：

Use systematic-debugging. First produce root-cause investigation findings and the top 2 hypotheses with evidence for each. Do not suggest code changes yet.

這能提升回答品質，因為它在讀症狀與改程式之間，先建立一道檢查點。

強制一次只驗證一個假設

很常見的失敗模式，是把好幾個可能原因一起混進同一個 patch。你可以要求：

目前最主要的假設
能推翻它的最小測試
什麼結果會支持它成立

這樣能讓 workflow 持續符合 skill 的原始意圖。

在 flaky-test 情境下，改善 systematic-debugging prompt

當你用 systematic-debugging for Debugging 處理 flaky tests 時，請提供：

測試通過／失敗的頻率
失敗是否和 parallelism 或 CI 有關
是否有使用 sleeps、waits、retries 或 polling
測試實際想觀察的是哪個事件或狀態

這會讓模型更容易辨識 condition-based-waiting.md 是否就是當前最相關的搭配模式。

不要只看 SKILL.md，也要用貼近原始碼的輔助檔案

如果第一次輸出看起來太泛，請明確引導模型去看這些支援文件：

root-cause-tracing.md：處理下游症狀
condition-based-waiting.md：處理時序／race 問題
defense-in-depth.md：處理驗證與防禦策略
find-polluter.sh：處理測試污染

當 agent 真的使用這些專門的輔助材料，而不只依賴主流程摘要時，這個 skill 的效果會更好。

第一輪之後，收斂範圍

如果第一輪結果太廣，可以再補充：

要檢查的精確子系統
你懷疑壞資料進入的邊界位置
問題第一次出現的 commit
最小可重現案例

過於寬泛的除錯 prompt，通常只會得到寬泛的除錯計畫。範圍縮小，根因分析通常會更有效。

不只改善診斷，也要改善最後的修法

找出 root cause 之後，可以再要求：

最小修正
一個 regression test
一層可防止再次發生的 validation layer

這時候 defense-in-depth.md 就派得上用場。如果 bug 來自無效輸入，或某些假設其實很容易被繞過，單一 patch 往往不夠。

注意這些常見失敗模式

不理想的 systematic-debugging usage 常見原因包括：

錯誤內容不完整
沒有可靠的重現方式
太早要求修法
每次測試之間同時改了很多東西
把第一個看起來合理的解釋當成已被證明

只要避開這些問題，這個 skill 通常會比泛泛的「幫我 debug」prompt 更有價值。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

web-perf

作者 cloudflare

web-perf 透過 Chrome DevTools MCP 分析網站效能。它會衡量 Core Web Vitals、以 trace 為基礎的載入問題、阻擋渲染的資源、版面位移、快取問題與可及性缺口。若你需要 Performance Optimization、除錯緩慢頁面，或依據最新文件與即時 traces 進行的 web-perf 指南式工作流程，都適合使用 web-perf skill。

性能优化

收藏 0GitHub 1.3k

playwright-best-practices

作者 currents-dev

playwright-best-practices 是一套針對 Playwright + TypeScript 的技能，聚焦於撰寫穩定測試、降低 flaky、優化 auth 流程、判斷 fixtures 與 page objects 的取捨，並以實務 repo 內容提供 CI、popups、mobile、iframes、websockets 與多使用者情境的操作指引。

测试自動化

收藏 0GitHub 174

autofix

作者 coderabbitai

autofix 可安全地把 CodeRabbit PR review-thread 的回饋，轉成目前 GitHub 分支上的已驗證程式碼變更。當你需要的是具備分支感知、並以明確授權為前提的 CodeRabbit Code Review 工作流程，而不是一般依照提示詞行事的修補工具時，就該使用這個 autofix skill。它會檢查 repo 狀態、讀取可信任指示，並只套用已驗證的修正。

程式碼評審

收藏 0GitHub 0

sentry

作者 openai

sentry skill 是一個唯讀的可觀測性工具，用來檢視 Sentry 的 issue、event 與 health signal。適合用來排查近期生產環境錯誤、摘要影響範圍，並以結構化輸出執行可重複的 CLI 查詢。當你需要的是一份實用的 sentry 排查指南，而不是全面性的可觀測性總覽時，它最合適。

Observability

收藏 0GitHub 0

aspire

作者 github

適用於 Deployment 的 aspire skill，涵蓋安裝、AppHost 設定、本機執行、Dashboard 除錯，以及 publish 工作流程。內容包含 CLI 用法、參考資料、疑難排解，並說明 publish 與 deploy 之間的關鍵分界。

部署

收藏 0GitHub 0

property-based-testing

作者 trailofbits

這份 property-based-testing 技能指南涵蓋如何在多種語言與 smart contracts 中撰寫、審查與改進 PBT。可用來辨識 roundtrip、idempotence、invariant、parser、validator 與 normalization 等情境，選擇合適的 generators，並判斷何時 property-based-testing 比 example-based tests 更有優勢。

Skill 测试

收藏 0GitHub 5k

terminal-ops

作者 affaan-m

terminal-ops 是一個以證據為先的 terminal 執行技能，適合處理命令執行與 repo 操作。可用來跑 commands、檢查 git 狀態、除錯 CI 或 builds，並在做出小範圍修正時清楚留下已變更與已驗證內容的證據。這份 terminal-ops 指南有助於減少 Code Editing 與 repo 操作時的猜測成本。

程式碼编辑

收藏 0GitHub 156.3k

investigate

作者 garrytan

investigate 技能可引導系統化除錯與根因分析，適用於壞掉、偶發不穩定或出現非預期行為的情況。當你需要先有證據再動手改 code 時，可用在 code review、incident triage、bug fixes，以及「昨天還能用」這類案例。它遵循四階段流程：investigate、analyze、hypothesize、implement。

程式碼評審

收藏 0GitHub 91.8k

browser-testing-with-devtools

作者 addyosmani

browser-testing-with-devtools 可透過 Chrome DevTools MCP 協助代理測試與除錯真實瀏覽器行為。可用來檢查 DOM、擷取主控台錯誤、分析網路請求、進行效能剖析，並在實際瀏覽器中驗證修正結果。

测试自動化

收藏 0GitHub 18.7k

libfuzzer

作者 trailofbits

libfuzzer 是一款針對使用 Clang 編譯的 C/C++ 專案、以覆蓋率為導向的 fuzzing 工具。這個 libfuzzer 技能可協助你完成安裝、理解並使用工作流程，從建立 harness、執行 sanitizers 到以最少設定啟動實用的安全稽核。

安全稽核

收藏 0GitHub 5k

vue-debug-guides

作者 vuejs-ai

vue-debug-guides 是一項專為 Vue 3 除錯設計的技能，可協助診斷執行階段錯誤、警告、非同步元件失敗、響應式問題，以及 SSR 或 hydration 不一致，並提供具針對性的參考式修正建議。

调试

收藏 0GitHub 2.1k

ios-simulator-skill

作者 conorluddy

ios-simulator-skill 是一個以任務為導向的 iOS 模擬器 skill，涵蓋具備可及性意識的 App 啟動、導覽、文字輸入、手勢操作、截圖、狀態擷取、建置/測試迴圈，以及模擬器生命週期控制。它的設計目標是降低 AI 代理、QA 工程師與開發者在重複性 iOS 測試自動化工作中的猜測成本。

测试自動化

收藏 0GitHub 0

datadog-cli

作者 softaworks

datadog-cli 可協助 agents 執行 Datadog CLI 工作流程，處理 logs、traces、metrics、services 與 dashboards。你可以了解如何設定 `DD_API_KEY` 與 `DD_APP_KEY`、使用 `npx @leoflores/datadog-cli` 指令，並掌握 `--site` 的用法，以及 dashboard 更新的安全注意事項，以支援 incident triage。

Observability

收藏 0GitHub 0

agent-introspection-debugging

作者 affaan-m

agent-introspection-debugging 技能提供一套結構化的 AI 代理自我除錯流程：先擷取失敗狀態，再判斷可能原因，接著執行受控的修復步驟，最後產出可供人閱讀的 introspection 報告。適合用在容易迴圈、重試頻繁或容易發散的執行情境，不適合一般性的驗證工作。

调试

收藏 0GitHub 156k

root-cause-tracing

作者 NeoLabHQ

root-cause-tracing 能幫你從症狀往回追查到最初的觸發點，快速排查失敗原因。它特別適合處理深層堆疊錯誤、誤導性的輸出，以及那些其實在更早階段就已經引入無效資料、錯誤路徑或工作目錄的情況。你可以把它當作 root-cause-tracing 的實務指南，用來進行更有紀律的除錯與更安全的修正。

调试

收藏 0GitHub 982

rust-patterns

作者 affaan-m

rust-patterns 是一份實用的 Rust 開發指南，聚焦慣用寫法，涵蓋 ownership、錯誤處理、traits、並行、模組邊界，以及偏向後端的設計取捨，幫助你寫出更安全、更乾淨的程式碼。

後端开发

收藏 0GitHub 156.2k