Skill 验证

瀏覽 Skill 建構下與 Skill 验证相關的 Agent Skill，並比較相近工作流、工具與使用情境。

31 個技能

springboot-verification

作者 affaan-m

springboot-verification 是一個針對 Spring Boot 專案的驗證迴圈，可在 PR 或部署前協助你確認變更是否安全。這份 springboot-verification 指南可用於建置驗證、靜態分析、含覆蓋率的測試、安全掃描，以及 Skill Validation。

Skill 验证

收藏 0GitHub 156.3k

santa-method

作者 affaan-m

santa-method 是一套多代理驗證工作流程，專為上線前必須正確無誤的輸出而設計。它透過獨立審查來找出內容、貼近程式碼的交付物、合規敏感文案與工作流程自動化任務中的盲點。當你需要可重複執行的「生成、驗證、收斂」循環時，就適合安裝 santa-method 技能。

工作流自動化

收藏 0GitHub 156.2k

rules-distill

作者 affaan-m

rules-distill 是給 Skill Authors 與 prompt library curator 使用的維護型技能。它會掃描已安裝的 skills，將重複模式歸納成可重用的 rules，並協助你以比通用 review prompt 更少的猜測來追加、修訂或建立 rule 檔案。

Skill 編寫

收藏 0GitHub 156.2k

eval-harness

作者 affaan-m

eval-harness 技能是一套正式的評估框架，適用於 Claude Code 工作階段與 eval-driven development。它能幫助你定義通過／失敗標準、建立能力與回歸評測，並在正式推出提示詞或工作流程變更前，衡量 agent 的可靠性。

模型評測

收藏 0GitHub 156.1k

continuous-learning-v2

作者 affaan-m

continuous-learning-v2 可將 Claude Code 工作階段轉為以專案為範圍的學習，結合 hooks、observer agents、信心分數，以及把重複模式升級為 skills、commands 或 agents。

Skill 編寫

收藏 0GitHub 156.1k

context-budget

作者 affaan-m

context-budget 技能可稽核 Claude Code 在 agents、skills、rules 與 MCP servers 上的 context 使用情況。它能協助找出內容膨脹、重複資訊與高成本元件，並回傳依優先順序排列的清理建議。這份 context-budget 指南適合想實際運用 context-budget，或在較大型環境中進行 Skill Testing 的使用者參考。

Skill 测试

收藏 0GitHub 156.1k

agent-sort

作者 affaan-m

agent-sort 是一個具備 repo 感知能力的技能，用來建立有證據支持的 ECC 安裝方案。它能協助你把技能、命令、規則、hooks 和額外項目分成 DAILY 與 LIBRARY 兩類，讓你只安裝專案實際會用到的內容。可將 agent-sort 技能用於安裝決策、agent-sort 使用情境，以及 Skill Authoring 工作流程中的實用 agent-sort 指南。

Skill 編寫

收藏 0GitHub 156k

writing-skills

作者 obra

writing-skills 是一份用於 Skill Authoring 的實作指南，協助你以測試驅動流程建立、編修與驗證 agent skills。內容涵蓋關鍵檔案、先備條件，以及在壓力情境、基準測試與精簡 SKILL.md 迭代中的實務做法。

Skill 編寫

收藏 0GitHub 121.9k

verification-before-completion

作者 obra

verification-before-completion 是一項結案前最終檢查技能，用來阻止沒有根據的完成宣告。本文說明何時該用、如何從 obra/superpowers 安裝，以及如何讓每一種狀態宣稱都對應到最新的驗證證據。

Skill 验证

收藏 0GitHub 121.9k

skill-creator

作者 anthropics

skill-creator 是一個用於撰寫技能的 meta-skill，可協助起草新技能、修改既有 `SKILL.md`、執行 eval、比較不同版本，並透過 repository 腳本與審查工具優化觸發描述。

Skill 編寫

收藏 2GitHub 105.1k

evaluation-methodology

作者 wshobson

evaluation-methodology 技能說明 Model Evaluation 中的 PluginEval 評分方法，涵蓋評估層級、評分規準、綜合計分、徽章門檻，以及如何解讀結果並改善較弱面向的實務建議。

模型評測

收藏 0GitHub 32.6k

context-degradation

作者 muratcankoylan

context-degradation 是一個實用技能，用於診斷長流程中的上下文失效，包括 lost-in-the-middle、poisoning、distraction、confusion 和 clash。可用來找出上下文在哪裡斷裂、判斷應先改什麼，並套用可重複使用的 context-degradation 指南，支援 Skill Authoring、prompt 放置與 production agent debugging。

Skill 編寫

收藏 0GitHub 15.6k

context-fundamentals

作者 muratcankoylan

context-fundamentals 是一份面向 AI agent 系統的 context engineering 實用指南。它能幫助你判斷哪些內容該放進 prompt、排查 context 問題，並透過更清晰的 context 結構來管理 token 預算。當你需要一份扎實的 context-fundamentals 指南，用於 agent 設計與 prompt 最佳化時，就適合使用這個 context-fundamentals 技能。

上下文工程

收藏 0GitHub 15.6k

skill-builder

作者 yusufkaraaslan

skill-builder 能協助技能作者，透過 Skill Seekers 將文件、GitHub repo、PDF、影片與程式碼庫轉成可供 AI 使用的技能。它包含來源類型偵測、建議工作流程，以及以工具驅動的步驟，讓技能撰寫可以重複執行，而不是一次性提示就結束。

Skill 編寫

收藏 0GitHub 13.5k

testing-handbook-generator

作者 trailofbits

testing-handbook-generator 是一個中繼技能，用來根據 Trail of Bits Testing Handbook（appsec.guide）建立 Claude Code skills。它協助 skill 作者、資安工程師與維護者，將手冊章節轉成可重複使用的 skills，並具備清楚的工作流程、範圍控管與可重複的生成方式。當你需要一份用於 handbook-to-skill 撰寫的 testing-handbook-generator 指南時，就適合使用這個 skill。

Skill 編寫

收藏 0GitHub 5k

audit-prep-assistant

作者 trailofbits

audit-prep-assistant 會依照 Trail of Bits 的檢查清單，協助將程式碼庫準備好以進行 Security Audit。它能幫助設定審查目標、執行靜態分析、提高測試覆蓋率、移除無用程式碼、記錄風險，並產生支援性素材，讓交付給稽核團隊時更乾淨俐落。

安全稽核

收藏 0GitHub 4.9k

create-skill-test

作者 dotnet

create-skill-test 會為 dotnet/skills 中的 agent skills 建立 eval.yaml 測試檔骨架。可用來建立技能測試、定義情境、fixtures、assertions 與 rubrics，並降低評估設計中的過擬合風險。這不是用來執行既有測試、排查 validator 錯誤，或撰寫 SKILL.md 檔案的工具。

Skill 测试

收藏 0GitHub 3k

create-skill

作者 dotnet

create-skill 是一個用來為新的 agent skills 建立骨架的產生器，風格對齊 dotnet/skills。它可用來建立有效的 skill 資料夾、產生含 frontmatter 的 SKILL.md，並依照 Skill Scaffolding 的倉庫規範進行。它最適合用於建立新技能，不適合拿來編輯既有技能。

Skill 脚手架

收藏 0GitHub 3k

skill-optimizer

作者 mcollina

skill-optimizer 協助作者提升 AI 技能的啟動率、清晰度與跨模型可靠性。適合用於 Skill Authoring：當技能已寫好卻不夠穩定地被遵循、觸發條件太弱、出現迴歸，或需要壓低上下文成本時。它支援基準測試迴圈、發布閘門，以及更高的使用一致性。

Skill 編寫

收藏 0GitHub 1.8k

skill-judge

作者 softaworks

skill-judge 是一個用來稽核 AI skill 套件與 SKILL.md 檔案的審查與評分 skill。它可協助作者與維護者判斷知識增量、觸發清晰度、工作流程品質，以及是否已具備發佈準備度，並提供可採取行動的改進建議。

Skill 验证

收藏 0GitHub 1.3k

judge

作者 NeoLabHQ

Judge 是一個兩階段評估技能，會先啟動 meta-judge，再由 judge 子代理在隔離上下文中，依據證據與明確標準替工作內容打分。當你需要一份可辯護的 judge 指南，而不是隨性意見時，可用於程式碼、寫作、分析或 Skill Authoring 的報告式審查。

Skill 編寫

收藏 0GitHub 982

do-and-judge

作者 NeoLabHQ

do-and-judge 技能會以子代理的實作步驟、獨立判定者與重試驗證機制來執行單一任務，直到通過或達到最大重試次數為止。當你需要明確的驗收標準、隔離式執行，以及比通用提示詞更少的猜測時，可在 Workflow Automation 中使用 do-and-judge。

工作流自動化

收藏 0GitHub 982

llm-patterns

作者 alinaqi

llm-patterns 幫助你設計 AI 優先的應用邏輯：由 LLM 負責推理、擷取與生成，程式碼則負責驗證、路由與錯誤處理。適合用 llm-patterns 技能建立更清晰的 prompt 結構、可測試的 LLM 工作流程，以及 Skill Authoring 的實用指引。

Skill 編寫

收藏 0GitHub 607

darwin-skill

作者 alchaincyf

darwin-skill 可用一套可重複執行的流程來改善 SKILL.md：先評估、再修訂、接著測試，最後決定保留或還原變更。它是為 Skill Authoring 打造，結合評分規準與以提示為基礎的驗證流程，並支援輸出來自 repo 範本與素材的視覺化結果。

Skill 編寫

收藏 0GitHub 549

Skill 验证

瀏覽 Skill 建構 下與 Skill 验证 相關的 Agent Skill，並比較相近工作流、工具與使用情境。

瀏覽 Skill 建構下與 Skill 验证相關的 Agent Skill，並比較相近工作流、工具與使用情境。