Skill 验证

浏览 Skill 构建 下与 Skill 验证 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

23 个技能
A
springboot-verification

作者 affaan-m

springboot-verification 是面向 Spring Boot 项目的验证闭环,帮助你在提交 PR 或部署前确认改动是否安全。可用这份 springboot-verification 指南进行构建校验、静态分析、带覆盖率的测试、安全扫描以及 Skill Validation。

Skill 验证
收藏 0GitHub 156.3k
A
santa-method

作者 affaan-m

santa-method 是一套多智能体验证工作流,适用于那些在发布前必须确保正确无误的输出。它通过独立复核来发现内容、代码相关交付物、合规敏感文案以及工作流自动化任务中的盲点。若你需要一个可重复的“生成、验证、收敛”循环,就安装 santa-method 技能。

工作流自动化
收藏 0GitHub 156.2k
A
rules-distill

作者 affaan-m

rules-distill 是面向 Skill 作者和 prompt 库策展人的维护型技能。它会扫描已安装的技能,把重复模式提炼成可复用的规则,并帮助你以比通用审查提示更少的猜测,去追加、修订或创建规则文件。

Skill 编写
收藏 0GitHub 156.2k
A
eval-harness

作者 affaan-m

eval-harness 技能是面向 Claude Code 会话和 eval 驱动开发的正式评估框架。它可以帮助你定义通过/失败标准,构建能力评估和回归评估,并在发布 prompt 或工作流变更前衡量 agent 的可靠性。

模型评测
收藏 0GitHub 156.1k
A
continuous-learning-v2

作者 affaan-m

continuous-learning-v2 将 Claude Code 会话转化为按项目作用域的学习流程,结合 hooks、observer agents、置信度评分,以及把重复模式晋升为 skills、commands 或 agents。

Skill 编写
收藏 0GitHub 156.1k
A
context-budget

作者 affaan-m

context-budget 技能会审计 Claude Code 在 agents、skills、rules 和 MCP servers 中的上下文使用情况。它能帮助识别臃肿内容、重复内容和高成本组件,并返回按优先级排序的清理建议。这个 context-budget 指南适合需要实际使用 context-budget 的场景,以及更大规模环境中的 Skill Testing。

Skill 测试
收藏 0GitHub 156.1k
A
agent-sort

作者 affaan-m

agent-sort 是一个具备仓库感知能力的技能,用于制定有证据支撑的 ECC 安装方案。它帮助将 skills、commands、rules、hooks 和 extras 分到 DAILY 与 LIBRARY 两个桶里,让你只安装项目实际会用到的内容。对于安装决策、agent-sort 用法,以及 Skill Authoring 工作流中的实用 agent-sort 指南,都很适合使用该技能。

Skill 编写
收藏 0GitHub 156k
O
writing-skills

作者 obra

writing-skills 是一份面向 Skill Authoring 的实用指南,用于以测试驱动的工作流创建、编辑和验证 agent skills。你可以快速了解关键文件、前置条件,以及如何处理压力场景、基线测试,并高效迭代简洁的 `SKILL.md`。

Skill 编写
收藏 0GitHub 121.9k
O
verification-before-completion

作者 obra

verification-before-completion 是一个用于最终检查的技能,专门防止在缺乏依据时宣称任务已完成。本文说明它适合在什么场景使用、如何从 obra/superpowers 安装,以及怎样让每一条“已修复”“已通过”“可评审”等状态声明都对应到最新的验证证据。

Skill 验证
收藏 0GitHub 121.9k
A
skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能,可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案,并借助仓库脚本和审查工具优化触发描述。

Skill 编写
收藏 2GitHub 105.1k
W
evaluation-methodology

作者 wshobson

evaluation-methodology 技能说明了用于 Model Evaluation 的 PluginEval 评分方法,包括评估层级、评分 rubric、综合评分、徽章阈值,以及如何解读结果并改进薄弱维度的实用建议。

模型评测
收藏 0GitHub 32.6k
T
testing-handbook-generator

作者 trailofbits

testing-handbook-generator 是一个元技能,用于基于 Trail of Bits Testing Handbook(appsec.guide)创建 Claude Code skills。它帮助技能作者、安全工程师和维护者把手册章节转化为可复用的技能,并具备清晰的工作流、范围控制和可重复的生成流程。当你需要一份用于从 handbook 到 skill 编写的 testing-handbook-generator 指南时,就使用这个技能。

Skill 编写
收藏 0GitHub 5k
T
audit-prep-assistant

作者 trailofbits

audit-prep-assistant 使用 Trail of Bits 的检查清单,为 Security Audit 进行代码库预备。它可以帮助设定审查目标、运行静态分析、提升测试覆盖率、清理无用代码、记录风险,并生成支持性材料,让审计交接更清晰顺畅。

安全审计
收藏 0GitHub 4.9k
S
skill-judge

作者 softaworks

skill-judge 是一项用于审查和评分的技能,适合审计 AI 技能包和 SKILL.md 文件。它可帮助作者与维护者评估知识增量、激活清晰度、工作流质量以及发布准备度,并提供可落地的改进建议。

Skill 验证
收藏 0GitHub 1.3k
N
judge

作者 NeoLabHQ

Judge 是一个两阶段评估技能:先启动 meta-judge,再启动 judge 子代理,在隔离上下文、证据和明确标准下对作品打分。适合用于代码、写作、分析或 Skill Authoring 的仅报告式审查;当你需要一份站得住脚的 judge 指南,而不是随口给出的意见时,它尤其合适。

Skill 编写
收藏 0GitHub 982
N
do-and-judge

作者 NeoLabHQ

do-and-judge 技能通过子代理执行步骤、独立评审和基于重试的验证来完成单个任务,直到通过或达到最大重试次数。对于需要明确验收标准、隔离执行,并且比通用 prompt 更少猜测的 Workflow Automation 场景,适合使用 do-and-judge。

工作流自动化
收藏 0GitHub 982
A
llm-patterns

作者 alinaqi

llm-patterns 可帮助你设计 AI 优先的应用逻辑:由 LLM 负责推理、抽取和生成,由代码负责校验、路由和错误处理。使用 llm-patterns 技能,可获得更清晰的 prompt 结构、可测试的 LLM 工作流,以及面向 Skill Authoring 的实用指导。

Skill 编写
收藏 0GitHub 607
A
darwin-skill

作者 alchaincyf

darwin-skill 通过一个可重复的闭环来改进 SKILL.md 文件:先评估,再修订、测试,最后保留或回滚更改。它面向 Skill Authoring,将 rubric 评分与基于 prompt 的验证结合起来,并支持从 repo 模板和 assets 生成可视化结果输出。

Skill 编写
收藏 0GitHub 549
C
skill-creator

作者 ComposioHQ

skill-creator 是一份 Skill Authoring 指南,帮助你创建或更新可复用的 Skills,并明确它们的适用范围、工作流、参考资料和脚本。当你需要让同一技能在多次会话中保持一致的行为、获得更实用的打包支持,并减少一次性提示带来的试错时,就适合使用 skill-creator 技能。

Skill 编写
收藏 0GitHub 48
N
reflect

作者 NeoLabHQ

reflect 是一个 Skill Validation 工具,用于审查先前的回复或输出。它通过复杂度分流和验证,在内容发布前捕捉遗漏的缺陷、薄弱推理以及过度自信的通过判断。

Skill 验证
收藏 0GitHub 0
L
full-output-enforcement

作者 Leonxlnx

full-output-enforcement 是一项用于完整、无删减输出的写作与执行护栏技能。它禁止占位符、部分交付和跳过中间段落,因此很适合在代码生成、文档编写、迁移和 Skill Authoring 等需要确保完整性的场景中使用。

Skill 编写
收藏 0GitHub 0
R
tutor

作者 RoundTable02

tutor 是一款面向 Obsidian StudyVault 用户的测验驱动学习技能,适合需要诊断性评估、概念级复习和进度追踪的人。它会识别语言、找到 vault、读取 dashboard,并通过结构化练习会话强化薄弱环节。需要可重复的学习检查,而不是通用聊天式 tutor 时,就用 tutor。

Skill 编写
收藏 0GitHub 0
D
skill-authoring-workflow

作者 deanpeters

skill-authoring-workflow 可帮助你把零散笔记、工作坊输出或草稿提示,整理成合规、可直接入库的 `skills/<skill-name>/SKILL.md`。使用这个 skill-authoring-workflow 技能,可以更少凭感觉来创建或更新 PM skills,遵循仓库规范,并在提交前完成校验。

Skill 编写
收藏 0GitHub 0
Skill 验证 Agent Skill