Skill 验证

瀏覽 Skill 建構 下與 Skill 验证 相關的 Agent Skill,並比較相近工作流、工具與使用情境。

31 個技能
A
springboot-verification

作者 affaan-m

springboot-verification 是一個針對 Spring Boot 專案的驗證迴圈,可在 PR 或部署前協助你確認變更是否安全。這份 springboot-verification 指南可用於建置驗證、靜態分析、含覆蓋率的測試、安全掃描,以及 Skill Validation。

Skill 验证
收藏 0GitHub 156.3k
A
santa-method

作者 affaan-m

santa-method 是一套多代理驗證工作流程,專為上線前必須正確無誤的輸出而設計。它透過獨立審查來找出內容、貼近程式碼的交付物、合規敏感文案與工作流程自動化任務中的盲點。當你需要可重複執行的「生成、驗證、收斂」循環時,就適合安裝 santa-method 技能。

工作流自動化
收藏 0GitHub 156.2k
A
rules-distill

作者 affaan-m

rules-distill 是給 Skill Authors 與 prompt library curator 使用的維護型技能。它會掃描已安裝的 skills,將重複模式歸納成可重用的 rules,並協助你以比通用 review prompt 更少的猜測來追加、修訂或建立 rule 檔案。

Skill 編寫
收藏 0GitHub 156.2k
A
eval-harness

作者 affaan-m

eval-harness 技能是一套正式的評估框架,適用於 Claude Code 工作階段與 eval-driven development。它能幫助你定義通過/失敗標準、建立能力與回歸評測,並在正式推出提示詞或工作流程變更前,衡量 agent 的可靠性。

模型評測
收藏 0GitHub 156.1k
A
continuous-learning-v2

作者 affaan-m

continuous-learning-v2 可將 Claude Code 工作階段轉為以專案為範圍的學習,結合 hooks、observer agents、信心分數,以及把重複模式升級為 skills、commands 或 agents。

Skill 編寫
收藏 0GitHub 156.1k
A
context-budget

作者 affaan-m

context-budget 技能可稽核 Claude Code 在 agents、skills、rules 與 MCP servers 上的 context 使用情況。它能協助找出內容膨脹、重複資訊與高成本元件,並回傳依優先順序排列的清理建議。這份 context-budget 指南適合想實際運用 context-budget,或在較大型環境中進行 Skill Testing 的使用者參考。

Skill 测试
收藏 0GitHub 156.1k
A
agent-sort

作者 affaan-m

agent-sort 是一個具備 repo 感知能力的技能,用來建立有證據支持的 ECC 安裝方案。它能協助你把技能、命令、規則、hooks 和額外項目分成 DAILY 與 LIBRARY 兩類,讓你只安裝專案實際會用到的內容。可將 agent-sort 技能用於安裝決策、agent-sort 使用情境,以及 Skill Authoring 工作流程中的實用 agent-sort 指南。

Skill 編寫
收藏 0GitHub 156k
O
writing-skills

作者 obra

writing-skills 是一份用於 Skill Authoring 的實作指南,協助你以測試驅動流程建立、編修與驗證 agent skills。內容涵蓋關鍵檔案、先備條件,以及在壓力情境、基準測試與精簡 SKILL.md 迭代中的實務做法。

Skill 編寫
收藏 0GitHub 121.9k
O
verification-before-completion

作者 obra

verification-before-completion 是一項結案前最終檢查技能,用來阻止沒有根據的完成宣告。本文說明何時該用、如何從 obra/superpowers 安裝,以及如何讓每一種狀態宣稱都對應到最新的驗證證據。

Skill 验证
收藏 0GitHub 121.9k
A
skill-creator

作者 anthropics

skill-creator 是一個用於撰寫技能的 meta-skill,可協助起草新技能、修改既有 `SKILL.md`、執行 eval、比較不同版本,並透過 repository 腳本與審查工具優化觸發描述。

Skill 編寫
收藏 2GitHub 105.1k
W
evaluation-methodology

作者 wshobson

evaluation-methodology 技能說明 Model Evaluation 中的 PluginEval 評分方法,涵蓋評估層級、評分規準、綜合計分、徽章門檻,以及如何解讀結果並改善較弱面向的實務建議。

模型評測
收藏 0GitHub 32.6k
M
context-degradation

作者 muratcankoylan

context-degradation 是一個實用技能,用於診斷長流程中的上下文失效,包括 lost-in-the-middle、poisoning、distraction、confusion 和 clash。可用來找出上下文在哪裡斷裂、判斷應先改什麼,並套用可重複使用的 context-degradation 指南,支援 Skill Authoring、prompt 放置與 production agent debugging。

Skill 編寫
收藏 0GitHub 15.6k
M
context-fundamentals

作者 muratcankoylan

context-fundamentals 是一份面向 AI agent 系統的 context engineering 實用指南。它能幫助你判斷哪些內容該放進 prompt、排查 context 問題,並透過更清晰的 context 結構來管理 token 預算。當你需要一份扎實的 context-fundamentals 指南,用於 agent 設計與 prompt 最佳化時,就適合使用這個 context-fundamentals 技能。

上下文工程
收藏 0GitHub 15.6k
Y
skill-builder

作者 yusufkaraaslan

skill-builder 能協助技能作者,透過 Skill Seekers 將文件、GitHub repo、PDF、影片與程式碼庫轉成可供 AI 使用的技能。它包含來源類型偵測、建議工作流程,以及以工具驅動的步驟,讓技能撰寫可以重複執行,而不是一次性提示就結束。

Skill 編寫
收藏 0GitHub 13.5k
T
testing-handbook-generator

作者 trailofbits

testing-handbook-generator 是一個中繼技能,用來根據 Trail of Bits Testing Handbook(appsec.guide)建立 Claude Code skills。它協助 skill 作者、資安工程師與維護者,將手冊章節轉成可重複使用的 skills,並具備清楚的工作流程、範圍控管與可重複的生成方式。當你需要一份用於 handbook-to-skill 撰寫的 testing-handbook-generator 指南時,就適合使用這個 skill。

Skill 編寫
收藏 0GitHub 5k
T
audit-prep-assistant

作者 trailofbits

audit-prep-assistant 會依照 Trail of Bits 的檢查清單,協助將程式碼庫準備好以進行 Security Audit。它能幫助設定審查目標、執行靜態分析、提高測試覆蓋率、移除無用程式碼、記錄風險,並產生支援性素材,讓交付給稽核團隊時更乾淨俐落。

安全稽核
收藏 0GitHub 4.9k
D
create-skill-test

作者 dotnet

create-skill-test 會為 dotnet/skills 中的 agent skills 建立 eval.yaml 測試檔骨架。可用來建立技能測試、定義情境、fixtures、assertions 與 rubrics,並降低評估設計中的過擬合風險。這不是用來執行既有測試、排查 validator 錯誤,或撰寫 SKILL.md 檔案的工具。

Skill 测试
收藏 0GitHub 3k
D
create-skill

作者 dotnet

create-skill 是一個用來為新的 agent skills 建立骨架的產生器,風格對齊 dotnet/skills。它可用來建立有效的 skill 資料夾、產生含 frontmatter 的 SKILL.md,並依照 Skill Scaffolding 的倉庫規範進行。它最適合用於建立新技能,不適合拿來編輯既有技能。

Skill 脚手架
收藏 0GitHub 3k
M
skill-optimizer

作者 mcollina

skill-optimizer 協助作者提升 AI 技能的啟動率、清晰度與跨模型可靠性。適合用於 Skill Authoring:當技能已寫好卻不夠穩定地被遵循、觸發條件太弱、出現迴歸,或需要壓低上下文成本時。它支援基準測試迴圈、發布閘門,以及更高的使用一致性。

Skill 編寫
收藏 0GitHub 1.8k
S
skill-judge

作者 softaworks

skill-judge 是一個用來稽核 AI skill 套件與 SKILL.md 檔案的審查與評分 skill。它可協助作者與維護者判斷知識增量、觸發清晰度、工作流程品質,以及是否已具備發佈準備度,並提供可採取行動的改進建議。

Skill 验证
收藏 0GitHub 1.3k
N
judge

作者 NeoLabHQ

Judge 是一個兩階段評估技能,會先啟動 meta-judge,再由 judge 子代理在隔離上下文中,依據證據與明確標準替工作內容打分。當你需要一份可辯護的 judge 指南,而不是隨性意見時,可用於程式碼、寫作、分析或 Skill Authoring 的報告式審查。

Skill 編寫
收藏 0GitHub 982
N
do-and-judge

作者 NeoLabHQ

do-and-judge 技能會以子代理的實作步驟、獨立判定者與重試驗證機制來執行單一任務,直到通過或達到最大重試次數為止。當你需要明確的驗收標準、隔離式執行,以及比通用提示詞更少的猜測時,可在 Workflow Automation 中使用 do-and-judge。

工作流自動化
收藏 0GitHub 982
A
llm-patterns

作者 alinaqi

llm-patterns 幫助你設計 AI 優先的應用邏輯:由 LLM 負責推理、擷取與生成,程式碼則負責驗證、路由與錯誤處理。適合用 llm-patterns 技能建立更清晰的 prompt 結構、可測試的 LLM 工作流程,以及 Skill Authoring 的實用指引。

Skill 編寫
收藏 0GitHub 607
A
darwin-skill

作者 alchaincyf

darwin-skill 可用一套可重複執行的流程來改善 SKILL.md:先評估、再修訂、接著測試,最後決定保留或還原變更。它是為 Skill Authoring 打造,結合評分規準與以提示為基礎的驗證流程,並支援輸出來自 repo 範本與素材的視覺化結果。

Skill 編寫
收藏 0GitHub 549
Skill 验证 Agent Skill