Skill 验证

浏览 Skill 构建下与 Skill 验证相关的 Agent Skill，并比较相近工作流、工具与使用场景。

31 个技能

springboot-verification

作者 affaan-m

springboot-verification 是面向 Spring Boot 项目的验证闭环，帮助你在提交 PR 或部署前确认改动是否安全。可用这份 springboot-verification 指南进行构建校验、静态分析、带覆盖率的测试、安全扫描以及 Skill Validation。

Skill 验证

收藏 0GitHub 156.3k

santa-method

作者 affaan-m

santa-method 是一套多智能体验证工作流，适用于那些在发布前必须确保正确无误的输出。它通过独立复核来发现内容、代码相关交付物、合规敏感文案以及工作流自动化任务中的盲点。若你需要一个可重复的“生成、验证、收敛”循环，就安装 santa-method 技能。

工作流自动化

收藏 0GitHub 156.2k

rules-distill

作者 affaan-m

rules-distill 是面向 Skill 作者和 prompt 库策展人的维护型技能。它会扫描已安装的技能，把重复模式提炼成可复用的规则，并帮助你以比通用审查提示更少的猜测，去追加、修订或创建规则文件。

Skill 编写

收藏 0GitHub 156.2k

eval-harness

作者 affaan-m

eval-harness 技能是面向 Claude Code 会话和 eval 驱动开发的正式评估框架。它可以帮助你定义通过/失败标准，构建能力评估和回归评估，并在发布 prompt 或工作流变更前衡量 agent 的可靠性。

模型评测

收藏 0GitHub 156.1k

continuous-learning-v2

作者 affaan-m

continuous-learning-v2 将 Claude Code 会话转化为按项目作用域的学习流程，结合 hooks、observer agents、置信度评分，以及把重复模式晋升为 skills、commands 或 agents。

Skill 编写

收藏 0GitHub 156.1k

context-budget

作者 affaan-m

context-budget 技能会审计 Claude Code 在 agents、skills、rules 和 MCP servers 中的上下文使用情况。它能帮助识别臃肿内容、重复内容和高成本组件，并返回按优先级排序的清理建议。这个 context-budget 指南适合需要实际使用 context-budget 的场景，以及更大规模环境中的 Skill Testing。

Skill 测试

收藏 0GitHub 156.1k

agent-sort

作者 affaan-m

agent-sort 是一个具备仓库感知能力的技能，用于制定有证据支撑的 ECC 安装方案。它帮助将 skills、commands、rules、hooks 和 extras 分到 DAILY 与 LIBRARY 两个桶里，让你只安装项目实际会用到的内容。对于安装决策、agent-sort 用法，以及 Skill Authoring 工作流中的实用 agent-sort 指南，都很适合使用该技能。

Skill 编写

收藏 0GitHub 156k

writing-skills

作者 obra

writing-skills 是一份面向 Skill Authoring 的实用指南，用于以测试驱动的工作流创建、编辑和验证 agent skills。你可以快速了解关键文件、前置条件，以及如何处理压力场景、基线测试，并高效迭代简洁的 `SKILL.md`。

Skill 编写

收藏 0GitHub 121.9k

verification-before-completion

作者 obra

verification-before-completion 是一个用于最终检查的技能，专门防止在缺乏依据时宣称任务已完成。本文说明它适合在什么场景使用、如何从 obra/superpowers 安装，以及怎样让每一条“已修复”“已通过”“可评审”等状态声明都对应到最新的验证证据。

Skill 验证

收藏 0GitHub 121.9k

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

evaluation-methodology

作者 wshobson

evaluation-methodology 技能说明了用于 Model Evaluation 的 PluginEval 评分方法，包括评估层级、评分 rubric、综合评分、徽章阈值，以及如何解读结果并改进薄弱维度的实用建议。

模型评测

收藏 0GitHub 32.6k

context-degradation

作者 muratcankoylan

context-degradation 是一项实用技能，用于诊断长流程中的上下文失效问题，包括 lost-in-the-middle、poisoning、distraction、confusion 和 clash。它可以帮助你定位上下文是在哪里断裂的，决定先改什么，并为 Skill Authoring、prompt 放置和生产环境中的 agent 调试提供一套可重复执行的 context-degradation 指南。

Skill 编写

收藏 0GitHub 15.6k

context-fundamentals

作者 muratcankoylan

context-fundamentals 是一份面向 AI agent 系统的 context engineering 实用指南。它能帮助你判断哪些内容该放进 prompt，排查 context 问题，并通过更清晰的 context 结构管理 token 预算。当你需要一份扎实的 context-fundamentals 指南，用于 agent 设计和 prompt 优化时，就适合使用这项 context-fundamentals 技能。

上下文工程

收藏 0GitHub 15.6k

skill-builder

作者 yusufkaraaslan

skill-builder 帮助 skill 作者借助 Skill Seekers，将文档、GitHub 仓库、PDF、视频和代码库转化为可供 AI 使用的 skills。它包含来源类型检测、推荐工作流以及基于工具的步骤，帮助你进行可重复的 skill 编写，而不是一次性提示词试验。

Skill 编写

收藏 0GitHub 13.5k

testing-handbook-generator

作者 trailofbits

testing-handbook-generator 是一个元技能，用于基于 Trail of Bits Testing Handbook（appsec.guide）创建 Claude Code skills。它帮助技能作者、安全工程师和维护者把手册章节转化为可复用的技能，并具备清晰的工作流、范围控制和可重复的生成流程。当你需要一份用于从 handbook 到 skill 编写的 testing-handbook-generator 指南时，就使用这个技能。

Skill 编写

收藏 0GitHub 5k

audit-prep-assistant

作者 trailofbits

audit-prep-assistant 使用 Trail of Bits 的检查清单，为 Security Audit 进行代码库预备。它可以帮助设定审查目标、运行静态分析、提升测试覆盖率、清理无用代码、记录风险，并生成支持性材料，让审计交接更清晰顺畅。

安全审计

收藏 0GitHub 4.9k

create-skill-test

作者 dotnet

create-skill-test 用于为 dotnet/skills 中的 agent 技能搭建 eval.yaml 测试文件骨架。可用它来创建技能测试、定义场景、fixtures、断言和 rubric，并降低评测设计中的过拟合风险。它不适合用于运行现有测试、排查 validator 报错或编写 SKILL.md 文件。

Skill 测试

收藏 0GitHub 3k

create-skill

作者 dotnet

create-skill 是一个用于按 dotnet/skills 风格创建新 agent skill 的脚手架生成器。可用它创建有效的 skill 文件夹、生成带 frontmatter 的 `SKILL.md`，并遵循 Skill Scaffolding 的仓库约定。它更适合新技能创建，不适合编辑已有技能。

Skill 脚手架

收藏 0GitHub 3k

skill-optimizer

作者 mcollina

skill-optimizer 帮助作者提升 AI 技能的激活率、清晰度和跨模型可靠性。适合用于 Skill Authoring：当技能已经写好却总是跟不对、触发条件不够明确、出现回归，或需要压缩上下文成本时使用。它支持基准测试循环、发布门禁，以及更高的使用一致性。

Skill 编写

收藏 0GitHub 1.8k

skill-judge

作者 softaworks

skill-judge 是一项用于审查和评分的技能，适合审计 AI 技能包和 SKILL.md 文件。它可帮助作者与维护者评估知识增量、激活清晰度、工作流质量以及发布准备度，并提供可落地的改进建议。

Skill 验证

收藏 0GitHub 1.3k

judge

作者 NeoLabHQ

Judge 是一个两阶段评估技能：先启动 meta-judge，再启动 judge 子代理，在隔离上下文、证据和明确标准下对作品打分。适合用于代码、写作、分析或 Skill Authoring 的仅报告式审查；当你需要一份站得住脚的 judge 指南，而不是随口给出的意见时，它尤其合适。

Skill 编写

收藏 0GitHub 982

do-and-judge

作者 NeoLabHQ

do-and-judge 技能通过子代理执行步骤、独立评审和基于重试的验证来完成单个任务，直到通过或达到最大重试次数。对于需要明确验收标准、隔离执行，并且比通用 prompt 更少猜测的 Workflow Automation 场景，适合使用 do-and-judge。

工作流自动化

收藏 0GitHub 982

llm-patterns

作者 alinaqi

llm-patterns 可帮助你设计 AI 优先的应用逻辑：由 LLM 负责推理、抽取和生成，由代码负责校验、路由和错误处理。使用 llm-patterns 技能，可获得更清晰的 prompt 结构、可测试的 LLM 工作流，以及面向 Skill Authoring 的实用指导。

Skill 编写

收藏 0GitHub 607

darwin-skill

作者 alchaincyf

darwin-skill 通过一个可重复的闭环来改进 SKILL.md 文件：先评估，再修订、测试，最后保留或回滚更改。它面向 Skill Authoring，将 rubric 评分与基于 prompt 的验证结合起来，并支持从 repo 模板和 assets 生成可视化结果输出。

Skill 编写

收藏 0GitHub 549

Skill 验证

浏览 Skill 构建 下与 Skill 验证 相关的 Agent Skill，并比较相近工作流、工具与使用场景。

浏览 Skill 构建下与 Skill 验证相关的 Agent Skill，并比较相近工作流、工具与使用场景。