test-driven-development

作者 obra

安裝並使用 test-driven-development 技能，落實嚴格 TDD：先寫會失敗的測試、確認測試確實失敗，再實作最小可行程式碼，最後安全重構。

Stars121.8k

評論0

加入時間2026年3月29日

分類测试自動化

安裝指令

npx skills add obra/superpowers --skill test-driven-development

編輯評分

這個技能的評分為 78/100，代表它是相當扎實的目錄收錄候選：代理可從明確的觸發條件（在功能開發、bug 修復、重構與行為變更中，`before writing implementation code`）判斷何時啟用；其操作規則定義清楚，流程指引也足夠完整，讓使用者比起一般泛用提示更能少靠猜測地執行 TDD。不過，目錄使用者仍應預期這比較偏向文件型技能，而不是工具完整的套件，因為它沒有提供支援腳本、安裝說明或內嵌自動化資產。

78/100

亮點

觸發條件非常明確：frontmatter 與 `When to Use` 清楚列出啟用時機，涵蓋常見情境與例外情況。
操作層面清晰：技能明確定義嚴格的 TDD 規則（`NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST`），並提供包含驗證步驟的 red-green-refactor 工作流程。
輔助參考資料實用：`testing-anti-patterns.md` 補充了具體範例，以及 mocks 與測試設計上的防呆原則，有助提升執行品質。

注意事項

採用方式偏手動：沒有 install 指令、腳本或支援檔案，因此使用者安裝的是一份指引文件，而非可直接執行的工作流程。
這套做法刻意採取高度嚴格的規範（`Always`、`No exceptions`、`Delete it. Start over.`），對採用較輕量或依情境調整測試實務的團隊來說，適配性可能有限。

测试 Codex Cursor 工作流操作手册开发者受众 Superpowers

總覽

test-driven-development skill 概覽

test-driven-development skill 實際會做什麼

test-driven-development skill 會為 AI 代理套用一套嚴格的 TDD 工作流程，用於功能開發、錯誤修正與行為變更：先寫測試、確認它是因為正確的原因而失敗，再寫出剛好能通過的最少正式程式碼，最後再安全重構。它的核心價值不只是「順便把測試也寫一寫」，而是強制執行正確順序，讓實作真正由可執行的行為規格來驅動。

這個 skill 最適合哪些人

這個 test-driven-development skill 很適合把 AI 用在真實 repository 開發工作的開發者，尤其是正確性很重要的情境：例如應用功能、服務邏輯、bug 修復、重構與避免回歸。若你常遇到模型直接跳進實作、沒有先界定可驗證行為，這個 skill 特別有幫助，因為它會迫使流程拆成更小、可檢查的步驟。

它真正解決的工作需求

多數人會安裝 test-driven-development，是因為一般 coding prompt 往往先產生程式碼，再事後補測試。這個 skill 會改變那種行為。它讓實作建立在「先失敗的測試」之上，因此代理產出的內容更容易審查，也較不容易憑空補出未驗證的行為。

它和一般「幫我寫測試」prompt 的真正差異

差異關鍵在於這個 skill 的「鐵律」：沒有先失敗的測試，就不能寫正式程式碼。這比一般提示嚴格得多。它也特別強調，第一個失敗必須是「正確的失敗」，不能只是任何紅燈都算數；這是很實務的防呆機制，而許多流於表面的 TDD 說明常常忽略這一點。

安裝前要先知道的重要限制

這是一個流程型 skill，不是針對特定框架的測試工具包。它不會幫你決定完整的測試架構，也沒有附帶 helper scripts 或大量參考資料，除了 SKILL.md 和 testing-anti-patterns.md 之外支援內容不多。如果你需要的是深入的 Jest、Pytest、JUnit 或 Playwright 設定教學，這個 skill 更適合作為工作流程層，而不是完整的測試手冊。

如何使用 test-driven-development skill

安裝 test-driven-development skill

可用以下指令從 repository 安裝：

npx skills add https://github.com/obra/superpowers --skill test-driven-development

如果你的環境支援本機 skill discovery，請先確認這個 skill 會以 test-driven-development 出現，並且在開始做功能開發前已可供代理使用。

先讀這些檔案

對這個 test-driven-development install 與使用流程，建議先看：

skills/test-driven-development/SKILL.md
skills/test-driven-development/testing-anti-patterns.md

先讀 SKILL.md，掌握整體流程與限制。若你的任務涉及 mocks、隔離測試、UI 測試，或有衝動想在正式程式碼裡加入只為測試存在的接縫，接著一定要讀 testing-anti-patterns.md。

先準備好這個 skill 需要的最低輸入

這個 skill 在你提供以下資訊時效果最好：

要做的功能、bug 或行為變更
相關檔案或模組邊界
repository 目前使用的測試框架
期望的使用者可見或系統可見行為
API 形狀、向下相容性或效能上的限制

如果缺少這些上下文，代理仍然可以機械式地套用 TDD，但很可能會選錯測試層級，或寫出比較迎合工具、卻不貼合你程式碼庫的測試。

把模糊需求改寫成可做 TDD 的 prompt

較弱的 prompt：

Add support for password reset.

較強的 prompt：

Use the test-driven-development skill. We need password reset in the existing Node/Express app. Write the first failing integration or service-level test before any production code. Verify the failure is for missing reset behavior, not setup issues. Then implement the minimum code to pass. Keep the current route style, use Jest, and avoid changing unrelated auth flows.

較強的版本提供了足夠上下文，讓代理可以選對第一個測試，並遵守 red-green-refactor 循環。

把這個 skill 當成分步流程用，不要一次生成整包

一個實際可行的 test-driven-development usage 模式是：

先只要求第一個失敗測試。
檢查這個失敗是否真的對準預期行為。
再要求能讓它通過的最小實作。
只有在 green 之後才要求重構。
對下一個小的行為切片重複同樣流程。

這樣通常會比一次要求完整功能產出更好，因為這個 skill 本來就是圍繞「小步、可驗證增量」而設計的。

正確驗證「red」階段

這份 test-driven-development guide 的一個關鍵細節是：測試失敗本身還不夠。這個失敗必須能證明測試真的對準了缺少的正確行為。如果測試是因為 import error、fixture 壞掉，或其他不相干的 setup 問題而失敗，那其實還不算真正開始這個循環。

在下 prompt 時，請明確要求代理說明：測試為什麼失敗，以及為什麼這個失敗是正確的失敗。

為 test-driven-development skill 選對第一個測試

最好的第一個測試，通常是最小但對外仍有意義的行為變更。好的候選包括：

重現一個 bug
一條商業規則
一個 endpoint 回應變更
一個 domain method 的行為
一個對使用者影響明確的 UI 互動

不好的起點則包括巨大的 end-to-end 情境、範圍很廣的 snapshot 覆蓋，或過早把內部實作綁死的測試。

一旦出現 mocks，就套用 anti-pattern 指南

如果代理開始過度使用 mocks，testing-anti-patterns.md 就很重要。這個 skill 明確警告，不要去測 mock 的行為，而要測真實行為。這點對 test-driven-development for Test Automation 特別重要，因為 AI 代理常會寫出針對 mock placeholder 的斷言，因為那比驗證真實輸出更容易滿足。

如果測試只是在檢查某個 mock 有 render、某個 mock 被很表面地呼叫，或為了讓測試成立而不得不在正式程式碼中加入只給測試用的方法，就該停下來重新界定測試範圍。

要求代理遵守這條鐵律

如果模型已經先草擬了實作，這個 skill 自身的指引是很嚴格的：刪掉正式程式碼，從失敗測試重新開始。實務上你不需要太戲劇化，但應該明確要求代理忽略先前猜測式的實作，重新依照 test-first 順序產生內容。

可直接使用這樣的措辭：

Do not continue from implementation-first code. Restart with a failing test and derive the implementation from that test.

讓這個 skill 對齊你 repository 的測試技術棧

這個 skill 以流程為核心，所以你需要把它綁定到自己的技術棧：

Python services 用 pytest
JS/TS 邏輯用 Jest 或 Vitest
Ruby 用 RSpec
Java 用 JUnit
Playwright 或同類工具只在行為真的屬於瀏覽器層時再用

如果你的 repo 已經有清楚的 test pyramid，請直接告訴代理這次變更應落在哪一層。否則模型很可能會預設採用最顯眼的測試型態，而不是成本最低、但已足夠有效的那一種。

真實 repository 工作可用的 prompt 範例

一個扎實的 test-driven-development skill prompt 可以長這樣：

Use the test-driven-development skill for a bug fix. In billing/invoice_service.py, invoices with zero-amount adjustments should remain payable if tax is still due. Start by writing the smallest failing pytest that reproduces the current bug. Confirm the failure is caused by the missing business rule, not fixture issues. Then implement the minimum fix, run or describe the expected green result, and suggest any safe refactor only after the test passes.

這個 prompt 同時提供了行為、位置、框架與審查標準。

test-driven-development skill 常見問題

如果我本來就懂 TDD，還值得安裝 test-driven-development 嗎？

值得，如果你的主要問題是讓 AI 代理真的照著 TDD 做，而不是只會嘴上談 TDD。test-driven-development skill 的價值比較不在教學，而是在替模型加上行為約束。

這個 skill 對新手友善嗎？

大致上算友善。流程本身簡單而且明確。對初學者來說，較難的是選對第一個測試與正確測試層級。如果你剛接觸測試，建議先拿這個 skill 用在小型 bug 修正，而不是直接套用到大型新功能。

什麼情況下 test-driven-development 不太適合？

對一次性原型、生成式程式碼，或純設定檔修改來說，它通常不是最理想的選擇，除非正確性風險很高，而且人工審查者仍希望維持 test-first 紀律。來源指引也明確把這些情況視為需要和人類協作者討論的例外。

它和一般 prompt 有什麼不同？

一般 prompt 常寫成「實作 X 並加上測試」。這個 skill 改變的是工作順序，而且把這個順序視為不可妥協。真正的價值就在這個排序，因為它能減少幻想式實作，並提高可審查性。

這個 skill 也涵蓋框架設定嗎？

不算深入。test-driven-development install 本身很直接，但 skill 內容並沒有提供大量框架專屬的設定文件。它假設你能把代理導向現有的測試技術棧或 repository 慣例。

我可以把 test-driven-development 用在重構嗎？

可以。當你需要確保行為維持穩定時，它很適合拿來做重構。實務上的模式通常是先用測試把目前行為鎖住，再在 green 的保護下進行重構。

它適合 UI 與 end-to-end 測試嗎？

有時候適合，但要小心使用。做 UI 工作時，anti-pattern 檔案特別重要，因為 AI 很容易滑向驗證 mock 是否存在，或驗證實作痕跡，而不是驗證真實使用者行為。請從你能驗證的最小真實使用者行為開始。

如何改善 test-driven-development skill 的使用效果

提供行為，不要先給解法

想得到更好的 test-driven-development usage，請描述預期行為與限制，而不是直接指定實作方式。TDD 最有效的狀態，是讓測試先界定結果，再讓程式碼從那些檢查中自然長出來。

較好的輸入：
Users should see an error when uploading files over 10MB.

較差的輸入：
Add a fileSizeValidator class and call it from the controller.

前者會保留空間，讓代理找到更乾淨、更精簡的實作。

明確指定你要的測試層級

很多品質不佳的結果，其實都來自測試範圍選錯。直接告訴代理你要的是：

單元層級的商業邏輯
圍繞 service 或 API 的整合測試
瀏覽器層級的行為

這一個選擇的重要性，往往比其他多數 prompt 細節都高。

強迫切成更小的增量

常見失敗模式之一，就是一次要求太多。如果模型同時寫出大範圍測試組與大塊實作，就把範圍縮小：

Pick one failing test that captures the first slice of behavior. Do not implement the whole feature yet.

這樣才能維持 test-driven-development 的循環完整性。

要求說明為什麼第一個測試是正確的

請要求代理說明：

為什麼這個測試是最小但有用的切片
預期會出現什麼精確失敗
為什麼這個失敗能證明該行為目前缺失

這麼做能提升品質，因為它會在實作開始前，先把隱含假設攤開來。

及早留意 anti-patterns

最常見的品質下滑包括：

測的是 mocks，不是行為
在正式程式碼裡加入只給測試用的方法
先寫會通過的測試，卻稱之為 TDD
寫出緊貼實作細節的斷言
測試一變綠就跳過重構步驟

只要看到其中一種，就先停止這一輪，要求重寫正確的第一個測試，而不是在錯誤基礎上繼續補丁。

明確提供 repository 慣例

當你清楚告訴這個 skill 以下資訊時，結果通常會更好：

測試命名慣例
測試放在哪裡
fixture 的使用模式
mocking policy
偏好的 assertion style

因為這個 repository 本身提供的支援資料偏輕量，所以這些在地慣例會實質影響產出品質。

在第一輪輸出後持續迭代

拿到初版結果後，不要只說「再多做一點」。請改用有方向的追問：

Can you make the failing test narrower?
Is this failure due to setup or missing behavior?
Can we remove this mock and test real behavior instead?
What is the minimum code needed to pass?
What refactor is now safe with tests green?

這是在實務上提升 test-driven-development skill 效果的最高槓桿做法：讓代理一直待在循環裡，而不是任由它往前亂跳。

對例外情況保留人工判斷

這個 skill 的設計本來就刻意嚴格。這是它的優勢，但也可能被過度套用。如果任務只是純設定變更、更新生成程式碼，或一次性原型，請先判斷完整 TDD 是否值得那個成本。把這個 skill 用在「test-first 順序真的會改善決策品質」的地方，效果會比「凡是能套就套」更好。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

playwright-interactive

作者 openai

playwright-interactive 是一個瀏覽器自動化技能，適用於本機網頁與 Electron 應用中的持久化 Playwright 工作階段。可用來檢查 UI 狀態、重試互動，以及執行功能或視覺 QA，而不必重啟工具鏈。當你需要一本實用的 playwright-interactive 迭代除錯指南時，特別適合使用。

瀏覽器自動化

收藏 0GitHub 0

playwright-skill

作者 testdino-hq

playwright-skill 是一份專為 Playwright 設計的可靠瀏覽器自動化指南。它能幫助團隊撰寫、除錯與擴充測試，涵蓋 E2E 流程、API 檢查、元件測試、視覺回歸、可及性、驗證、CI/CD，以及從 Cypress 或 Selenium 遷移。當你需要的是實用模式，而不是泛用的測試建議時，就適合使用 playwright-skill。

测试自動化

收藏 0GitHub 0

laravel-tdd

作者 affaan-m

laravel-tdd 是一份適用於 Laravel 的測試驅動開發指南，涵蓋 PHPUnit 與 Pest。它可協助你判斷單元、功能與整合測試的選擇，規劃資料庫策略、使用 fakes、設定覆蓋率目標，以及建立實用的測試自動化工作流程。

测试自動化

收藏 0GitHub 156.2k

cpp-testing

作者 affaan-m

cpp-testing 技能可協助你使用 GoogleTest、GoogleMock、CMake 與 CTest 來撰寫、執行與除錯 C++ 測試。適合用於覆蓋率分析、修正不穩定測試、以 sanitizer 為基礎的診斷，以及在現代 C++ 專案中實作實用的 cpp-testing 工作流程。

测试自動化

收藏 0GitHub 156.1k

test-driven-development

作者 addyosmani

test-driven-development 技能可協助你先寫出會失敗的測試，再用最小幅度的修正讓測試通過。適合用於邏輯變更、錯誤修復、回歸問題與邊界情境，特別是在你需要可驗證證據，而不只是看似合理的修補方案時。

Skill 测试

收藏 0GitHub 18.8k

wp-playground

作者 WordPress

wp-playground skill 可協助你建立可丟棄、可重現的 WordPress Playground 環境，用於外掛與佈景主題測試、版本切換、blueprints、snapshots 以及隔離式除錯。它支援透過 @wp-playground/cli 的瀏覽器或 CLI 工作流程，特別適合後端開發、QA，以及受控的問題重現。

後端开发

收藏 0GitHub 1.4k

playwright-best-practices

作者 currents-dev

playwright-best-practices 是一套針對 Playwright + TypeScript 的技能，聚焦於撰寫穩定測試、降低 flaky、優化 auth 流程、判斷 fixtures 與 page objects 的取捨，並以實務 repo 內容提供 CI、popups、mobile、iframes、websockets 與多使用者情境的操作指引。

测试自動化

收藏 0GitHub 174

playwright-skill

作者 lackeyjb

playwright-skill 是一個瀏覽器自動化技能，適合用來測試頁面、填寫表單、檢查連結、截圖、驗證響應式版面，以及處理登入或結帳流程。它會自動偵測開發伺服器，搭配通用執行器，幫助你用更少的設定與猜測，穩定執行 Playwright 任務。

瀏覽器自動化

收藏 0GitHub 0

property-based-testing

作者 trailofbits

這份 property-based-testing 技能指南涵蓋如何在多種語言與 smart contracts 中撰寫、審查與改進 PBT。可用來辨識 roundtrip、idempotence、invariant、parser、validator 與 normalization 等情境，選擇合適的 generators，並判斷何時 property-based-testing 比 example-based tests 更有優勢。

Skill 测试

收藏 0GitHub 5k

terraform-test

作者 hashicorp

terraform-test 是一份實用指南，教你如何使用 `.tftest.hcl` 檔案、`run` 區塊、assertions、mocks，以及適合 CI 的工作流程來撰寫與執行 Terraform 測試。可用來在合併前驗證 module outputs、resource arguments、條件邏輯，以及 plan 或 apply 行為。

程式碼生成

收藏 0GitHub 583

browser-testing-with-devtools

作者 addyosmani

browser-testing-with-devtools 可透過 Chrome DevTools MCP 協助代理測試與除錯真實瀏覽器行為。可用來檢查 DOM、擷取主控台錯誤、分析網路請求、進行效能剖析，並在實際瀏覽器中驗證修正結果。

测试自動化

收藏 0GitHub 18.7k

ios-simulator-skill

作者 conorluddy

ios-simulator-skill 是一個以任務為導向的 iOS 模擬器 skill，涵蓋具備可及性意識的 App 啟動、導覽、文字輸入、手勢操作、截圖、狀態擷取、建置/測試迴圈，以及模擬器生命週期控制。它的設計目標是降低 AI 代理、QA 工程師與開發者在重複性 iOS 測試自動化工作中的猜測成本。

测试自動化

收藏 0GitHub 0

autoresearch

作者 github

autoresearch 是一套用於程式開發任務的自主實驗迴圈，特別適合有可量化成果的情境。它會協助開發者先定義目標、基準、衡量指標與範圍，再透過以 git 檢查點為基礎的流程，反覆進行程式碼修改、測試，以及保留或還原變更的判斷。

工作流自動化

收藏 0GitHub 0

atheris

作者 trailofbits

Atheris 是一個建立在 libFuzzer 上、以覆蓋率導向的 Python fuzzing skill。可用 atheris skill 來 fuzz 純 Python 程式碼與 Python C extension，找出當機、卡住與記憶體安全漏洞，並以快速、實用的 harness 指引支援 Security Audit 工作流程。

安全稽核

收藏 0GitHub 5k

playwright-cli

作者 VoltAgent

playwright-cli 是一個可從命令列操作 Playwright 的瀏覽器自動化技能。它可協助開啟頁面、檢查元素、點選流程、填寫表單、擷取截圖、模擬請求，以及從真實互動產生測試程式。適合需要可重複執行的瀏覽器自動化與 UI 測試情境。

瀏覽器自動化

收藏 0GitHub 8.5k

playwright

作者 openai

使用 playwright 技能，透過終端機搭配包裝腳本與 `playwright-cli` 操控真實瀏覽器。它適合各類瀏覽器自動化工作，例如導覽、表單填寫、截圖、快照、資料擷取與 UI 流程除錯。先確認 `npx` 是否可用，安裝技能，設定 `PWCLI`，再依照以 CLI 為先的工作流程執行。

瀏覽器自動化

收藏 0GitHub 0