verification-before-completion

作者 obra

verification-before-completion 是一項結案前最終檢查技能，用來阻止沒有根據的完成宣告。本文說明何時該用、如何從 obra/superpowers 安裝，以及如何讓每一種狀態宣稱都對應到最新的驗證證據。

Stars121.9k

評論0

加入時間2026年3月29日

分類Skill 验证

安裝指令

npx skills add obra/superpowers --skill verification-before-completion

編輯評分

這項技能評分為 78/100，對目錄使用者來說是相當穩健的上架候選。它的觸發時機明確、也容易理解：說明文字與「Iron Law」清楚告訴代理何時該啟用，以及在宣稱成功前必須落實哪些行為。它的價值主要偏向行為約束而非流程自動化，因此能提升可靠性，但使用者也應預期需要自行提供專案專屬的驗證指令。

78/100

亮點

觸發條件非常清楚：在宣稱工作已完成、已修復或已通過前使用，尤其是在 commit 或 PR 之前。
操作核心寫得很明確：找出可證明結果的指令、重新執行、讀完整輸出、核對宣稱內容，最後附上證據回報。
對避免空泛宣稱的指引很扎實，並以 tests、lint、build 與 bug 修復驗證等具體失敗情境作為示例。

注意事項

未提供支援檔案、腳本或 repo 專屬的指令參考，因此代理仍需依上下文自行判斷正確的驗證指令。
這項技能比較像規範而非可直接執行的工作流程；它很能強化紀律，但在陌生專案中協助選出正確指令的實務支援有限。

测试 Codex Copilot 工作流检查清單操作手册规则开发者受众

總覽

verification-before-completion 技能總覽

verification-before-completion 是做什麼用的

verification-before-completion 技能是一套嚴格的最後確認流程，專門用在你正準備說工作「完成了」、「修好了」、「測試通過了」或「可以送審了」的那一刻。它的任務很單純：先阻止沒有根據的成功宣告，要求先拿到最新驗證證據再說。

這個技能特別適合用在 AI 輔助寫程式、agent 工作流程、準備 commit，以及 PR 交接的情境。如果你曾看過有人在根本沒跑對應指令的情況下，就寫出「tests should pass」、「the bug is fixed」或「build looks good」，那 verification-before-completion 正是用來處理這種失誤模式。

誰適合安裝這個技能

最適合的使用者包括：

使用 AI agents 修改程式碼的開發者
希望狀態更新更乾淨、且有證據支撐的 reviewer
已經受夠過度樂觀、卻沒有驗證依據完成訊息的團隊
採用 Skill Validation 模式，且把證明看得比信心更重要的人

如果你主要需要的是程式碼生成、規劃，或廣泛的除錯協助，那這個技能不能取代那些用途。verification-before-completion 是一道防護欄，不是完整的交付流程。

真正要完成的工作是什麼

真正的工作不是「跑測試」而已，而是：

先辨認出什麼證據才能證明這個說法成立
立刻跑那個精確的驗證
讀取實際輸出結果
只說出證據真正支持的內容

這聽起來很理所當然，但很多 AI 輔助工作流程正是卡在這裡。verification-before-completion 把這個期待變成完成宣告前的一道硬性關卡。

這個技能有什麼不同

verification-before-completion 最大的差異，在於它非常聚焦。它不試圖聰明地理解你整個 repository，而是只強制執行一條高價值規則：

沒有最新的驗證證據，就不能做完成宣告

正因為它夠窄、夠明確，所以特別適合作為收尾階段的技能。和一般「小心一點、記得驗證」這類 prompt 相比，verification-before-completion 更容易穩定觸發，因為它提供的是一個可重複執行的判斷流程：先辨認、再執行、再閱讀、再驗證，最後才發言。

什麼情況下 verification-before-completion 特別適合

當你準備說出下列這種話時，就很適合使用 verification-before-completion：

「tests pass」
「the bug is fixed」
「the build succeeds」
「this is ready to merge」
「the linter is clean」

這些說法各自需要不同的證據。verification-before-completion 可以幫你避免一個很常見的錯誤：明明只證明了相鄰的事情，最後卻把結論說得更大。

如何使用 verification-before-completion 技能

verification-before-completion 的安裝情境

請從 obra/superpowers repository 安裝：

npx skills add https://github.com/obra/superpowers --skill verification-before-completion

由於這個技能只包含在單一的 SKILL.md 中，導入成本很低。你不需要先理解輔助腳本，也沒有額外的資源檔案要先看。

先讀這個檔案

從這裡開始：

skills/verification-before-completion/SKILL.md

這個檔案就包含了完整的行為契約。由於這個技能的 repository 支援結構非常精簡，先讀 SKILL.md 就足以判斷它是否符合你的工作流程。

這個技能需要你提供哪些輸入

verification-before-completion 在你提供以下三項資訊時效果最好：

你正準備提出的主張
真正能證明該主張的指令
任何阻礙驗證的環境限制

輸入範例：

「I want to say the fix works. The proving command is pytest tests/api/test_login.py -q.」
「I want to say the build passes. The expected verification is npm run build.」
「I think lint is clean, but I have not run ruff check . yet.」

如果沒有明確的主張和具體指令，verification-before-completion 只能給你比較泛泛的提醒。

把模糊目標改寫成可用的 prompt

弱的 prompt：

「Can I say this is done?」

更好的 prompt：

「Before I claim this is complete, apply the verification-before-completion skill. The claim is: ‘the login bug is fixed.’ The best proving command is pytest tests/auth/test_login_bug.py -q. If that is not enough, tell me what additional verification is required.」

為什麼這樣比較好：

它明確指出了主張內容
它先提出了一條可驗證的證明路徑
它允許技能挑戰證據不足的驗證方式

實務上怎麼呼叫這個技能

在任何完成式訊息、commit 摘要或 PR 說明之前，先用 verification-before-completion。一個實用的流程如下：

完成程式碼修改
決定你要提出的精確主張是什麼
找出能證明該主張的指令
重新完整執行一次那個指令
檢查輸出內容與 exit status
如果證據不完整，就下修或加註限定條件

這個順序很重要。人在最想樂觀總結的那一刻，verification-before-completion 的價值最高。

讓主張對應到正確證據

verification-before-completion 在實務上最大的好處之一，就是阻止「證據和主張對不起來」的情況。

例如：

主張：「Tests pass」
證據：對應的完整測試指令，且零失敗
主張：「Linter is clean」
證據：linter 指令輸出顯示零錯誤
主張：「Build succeeds」
證據：build 指令成功結束
主張：「Bug is fixed」
證據：能重現原始失敗路徑的驗證步驟，且現在已通過

linter 通過，不能證明 build 一定成功。檔案改過了，也不能證明 bug 已修好。這種區分正是很多弱 agent 輸出會失手的地方。

什麼才算最新的驗證證據

所謂最新，指的是這個指令是針對目前這個工作狀態執行的，不是憑前一次的記憶帶過。實務上代表：

不依賴舊的 terminal 輸出
不假設檔案沒變、結果就一定沒變
不從旁邊的訊號推論成功
不用局部驗證去支撐更大的主張

如果你在上一次執行後又改了程式碼，那對於完成宣告來說，先前那次執行就已經過期了。

無法執行驗證時該怎麼做

有時候環境就是不允許你執行：可能缺少 dependencies、沒有 credentials、服務不可用、作業系統不支援，或時間不夠。這種情況下，就不要做更強的主張。

請改用以證據為基礎的描述：

「I made the change, but I could not run npm test in this environment.」
「The fix is implemented, but build verification remains unconfirmed.」
「I verified formatting only; full integration tests were not run.」

即使是這樣，verification-before-completion 仍然算是成功使用了，因為它的重點是誠實回報狀態，而不是硬湊出確定性。

給 agents 的實用 prompt 模式

一個可重複使用、效果不錯的 prompt：

「Use the verification-before-completion skill before any success claim. For each claim, identify the proving command, run it fresh if possible, read the full output, and only state what the evidence confirms. If verification is blocked, report the limitation instead of implying success.」

這種寫法很適合放進 agent 指示、PR 助手，以及 commit 產生流程中。

Skill Validation 情境下的最佳工作流程

針對 verification-before-completion for Skill Validation，請把它當成最後的驗證者，而不是主要執行者。比較好的順序是：

先用其他技能完成實作或除錯
再切換到 verification-before-completion
驗證你準備對外發布的狹義主張
產出附帶指令與結果證據的摘要

這種分工能提高信任感，因為實作和驗證沒有混在一起。

verification-before-completion 技能 FAQ

verification-before-completion 只是提醒你記得跑測試嗎？

不是。verification-before-completion 比單純提醒更嚴格。它要求主張和證明之間要有明確對應。重點不是只是「跑點什麼」，而是「執行能證明你即將說出口那句話的那個指令」。

這個技能對新手有用嗎？

有，尤其適合還在學習「不同檢查到底能證明什麼」的新手。它會培養一個很重要的習慣：不要把結論講得超出證據範圍。這個習慣同時能提升技術準確度，也能增加 reviewer 對你的信任。

什麼情況下不該使用 verification-before-completion？

不要把它當成你唯一的寫程式或除錯技能。它不會幫你設計架構、定位根因，也不會替你寫完整測試計畫。verification-before-completion 比較像收尾檢查點，最適合和偏實作導向的技能搭配使用。

它比一般 prompt 好在哪裡？

一般 prompt 常常只會說「回答前先驗證」，但 agent 還是很容易滑向模糊、偏軟的主張。如果你要的是一個穩定的完成前關卡，並且對沒有根據的斷言有明確後果，那 verification-before-completion skill 會比普通 prompt 更好用。

它需要特定技術棧或工具鏈嗎？

不需要。verification-before-completion 是 stack-agnostic，因為它關心的是證據邏輯，不是程式語言或 framework。你只需要提供符合自己環境的證明指令，不管那是 pytest、npm test、go test、cargo test，還是其他驗證工具都可以。

如果完整驗證成本太高，還能用嗎？

可以，但你的主張也必須跟著縮小。如果你只跑了針對性的測試，就只能說那個針對性的測試已通過。除非你真的做了更完整的驗證，否則不要把它升級成「全部都通過」。

如何改進 verification-before-completion 技能的使用效果

在要求驗證前，先把主張講清楚

最能提升輸出品質的一件事，就是直接寫出你差點想貼出去的那一句話。例如：

弱：「validate this」
強：「I want to say: ‘the payment bug is fixed and tests pass’」

這能幫助 verification-before-completion 把複合主張拆開，並分別配置對應證據。

明確寫出最佳的證明指令

如果你本來就知道 repository 的慣例，就不要讓 verification-before-completion 猜。更好的輸入方式像是：

「The canonical project check is make test.」
「The bug is proven by pytest tests/payments/test_refund.py -q plus npm run build.」

這樣可以降低因為檢查不完整而產生的錯誤信心。

把實作狀態和已驗證狀態分開

常見失誤之一，是把「我改了程式碼」和「問題已解決」混在一起。想改進 verification-before-completion usage，可以直接要求它用兩段式回覆：

改了什麼
實際驗證了什麼

即使執行受阻，這也能讓摘要維持誠實。

不要用狹窄檢查去支撐寬泛主張

如果你只跑了一個聚焦測試，就不要要求 verification-before-completion 替整個 repo 背書。比較好的說法是：

「Can I say the targeted regression test now passes?」
不要說：「Can I say the system is fully fixed?」

這是這個技能最值得養成的高價值習慣之一。

當證據不完整時，要求它提供降級措辭

在真實工作裡，想讓 verification-before-completion guide 更實用，一個很好用的方法是主動要求 fallback wording：

「If the claim is too strong for the evidence, rewrite it to the strongest accurate version.」

這樣一來，它就不只是擋下過度宣告的工具，也成了改善溝通品質的工具。

有實質修改後要重新跑一次

如果你在一次成功驗證後又改了程式碼，請再次使用 verification-before-completion。最新證據只對應目前狀態，不對應上一個草稿版本。這在高速 agent loop 裡尤其重要，因為一個「最後的小修改」就可能讓前面的檢查失效。

在最終摘要中直接附上證據

如果想提高信任感，請在完成說明裡直接放入證據：

執行了什麼指令
pass/fail 結果
任何限制或遺漏項目

例如：

「Verified with pytest tests/auth/test_login_bug.py -q: passed, 1 test, 0 failures.」
「Did not verify full integration suite in this environment.」

這種寫法會讓 verification-before-completion 對 reviewer 和未來的自己都更有價值。

留意最常見的失敗模式

verification-before-completion for Skill Validation 最常見的誤用，是根據意圖、程式碼變更，或主觀預期來宣稱成功，而不是根據實際輸出。如果你想得到更好的結果，請在每次完成訊息前最後問自己一次：

「What command output would make this statement true?」

如果你沒辦法清楚回答，那這個主張大概還沒準備好。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

skill-creator

作者 anthropics

skill-creator 是一個用於撰寫技能的 meta-skill，可協助起草新技能、修改既有 `SKILL.md`、執行 eval、比較不同版本，並透過 repository 腳本與審查工具優化觸發描述。

Skill 編寫

收藏 2GitHub 105.1k

evaluation-methodology

作者 wshobson

evaluation-methodology 技能說明 Model Evaluation 中的 PluginEval 評分方法，涵蓋評估層級、評分規準、綜合計分、徽章門檻，以及如何解讀結果並改善較弱面向的實務建議。

模型評測

收藏 0GitHub 32.6k

writing-skills

作者 obra

writing-skills 是一份用於 Skill Authoring 的實作指南，協助你以測試驅動流程建立、編修與驗證 agent skills。內容涵蓋關鍵檔案、先備條件，以及在壓力情境、基準測試與精簡 SKILL.md 迭代中的實務做法。

Skill 編寫

收藏 0GitHub 121.9k

eval-harness

作者 affaan-m

eval-harness 技能是一套正式的評估框架，適用於 Claude Code 工作階段與 eval-driven development。它能幫助你定義通過／失敗標準、建立能力與回歸評測，並在正式推出提示詞或工作流程變更前，衡量 agent 的可靠性。

模型評測

收藏 0GitHub 156.1k

continuous-learning-v2

作者 affaan-m

continuous-learning-v2 可將 Claude Code 工作階段轉為以專案為範圍的學習，結合 hooks、observer agents、信心分數，以及把重複模式升級為 skills、commands 或 agents。

Skill 編寫

收藏 0GitHub 156.1k

context-budget

作者 affaan-m

context-budget 技能可稽核 Claude Code 在 agents、skills、rules 與 MCP servers 上的 context 使用情況。它能協助找出內容膨脹、重複資訊與高成本元件，並回傳依優先順序排列的清理建議。這份 context-budget 指南適合想實際運用 context-budget，或在較大型環境中進行 Skill Testing 的使用者參考。

Skill 测试

收藏 0GitHub 156.1k

audit-prep-assistant

作者 trailofbits

audit-prep-assistant 會依照 Trail of Bits 的檢查清單，協助將程式碼庫準備好以進行 Security Audit。它能幫助設定審查目標、執行靜態分析、提高測試覆蓋率、移除無用程式碼、記錄風險，並產生支援性素材，讓交付給稽核團隊時更乾淨俐落。

安全稽核

收藏 0GitHub 4.9k

skill-judge

作者 softaworks

skill-judge 是一個用來稽核 AI skill 套件與 SKILL.md 檔案的審查與評分 skill。它可協助作者與維護者判斷知識增量、觸發清晰度、工作流程品質，以及是否已具備發佈準備度，並提供可採取行動的改進建議。

Skill 验证

收藏 0GitHub 1.3k

do-and-judge

作者 NeoLabHQ

do-and-judge 技能會以子代理的實作步驟、獨立判定者與重試驗證機制來執行單一任務，直到通過或達到最大重試次數為止。當你需要明確的驗收標準、隔離式執行，以及比通用提示詞更少的猜測時，可在 Workflow Automation 中使用 do-and-judge。

工作流自動化

收藏 0GitHub 982

darwin-skill

作者 alchaincyf

darwin-skill 可用一套可重複執行的流程來改善 SKILL.md：先評估、再修訂、接著測試，最後決定保留或還原變更。它是為 Skill Authoring 打造，結合評分規準與以提示為基礎的驗證流程，並支援輸出來自 repo 範本與素材的視覺化結果。

Skill 編寫

收藏 0GitHub 549

tutor

作者 RoundTable02

tutor 是一個以測驗為核心的學習技能，適合 Obsidian StudyVault 使用者做診斷式評量、概念層級複習與進度追蹤。它會偵測語言、找到 vault、讀取 dashboard，並透過結構化練習針對弱項加強。當你需要可重複的學習檢查，而不是一般聊天式家教時，就很適合用 tutor。

Skill 編寫

收藏 0GitHub 0

skill-authoring-workflow

作者 deanpeters

skill-authoring-workflow 可協助你把零散筆記、工作坊產出或草稿提示，整理成符合規範、可直接放進 repo 的 `skills/<skill-name>/SKILL.md`。使用這個 skill-authoring-workflow skill，可以更有把握地建立或更新 PM skills，遵循 repo 標準，並在提交前完成驗證。

Skill 編寫

收藏 0GitHub 0

springboot-verification

作者 affaan-m

springboot-verification 是一個針對 Spring Boot 專案的驗證迴圈，可在 PR 或部署前協助你確認變更是否安全。這份 springboot-verification 指南可用於建置驗證、靜態分析、含覆蓋率的測試、安全掃描，以及 Skill Validation。

Skill 验证

收藏 0GitHub 156.3k

santa-method

作者 affaan-m

santa-method 是一套多代理驗證工作流程，專為上線前必須正確無誤的輸出而設計。它透過獨立審查來找出內容、貼近程式碼的交付物、合規敏感文案與工作流程自動化任務中的盲點。當你需要可重複執行的「生成、驗證、收斂」循環時，就適合安裝 santa-method 技能。

工作流自動化

收藏 0GitHub 156.2k

rules-distill

作者 affaan-m

rules-distill 是給 Skill Authors 與 prompt library curator 使用的維護型技能。它會掃描已安裝的 skills，將重複模式歸納成可重用的 rules，並協助你以比通用 review prompt 更少的猜測來追加、修訂或建立 rule 檔案。

Skill 編寫

收藏 0GitHub 156.2k

llm-patterns

作者 alinaqi

llm-patterns 幫助你設計 AI 優先的應用邏輯：由 LLM 負責推理、擷取與生成，程式碼則負責驗證、路由與錯誤處理。適合用 llm-patterns 技能建立更清晰的 prompt 結構、可測試的 LLM 工作流程，以及 Skill Authoring 的實用指引。

Skill 編寫

收藏 0GitHub 607