Skill 测试

浏览 Skill 构建 下与 Skill 测试 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

32 个技能
A
verification-loop

作者 affaan-m

verification-loop 是一个用于 Claude Code 的验证工作流,用来在代码变更后检查构建、类型、lint、测试、安全性和 diff。这个 verification-loop 技能很适合在发 PR 之前或重构之后使用,当你需要的是一套结构化的变更后检查指南,而不是一个泛泛的提示词时。

验证
收藏 0GitHub 156.3k
A
rust-testing

作者 affaan-m

rust-testing 是一份实用指南,覆盖 Rust 测试模式,包括单元测试、集成测试、异步测试、基于属性的测试、mock 和覆盖率。它能帮助你更准确地选择合适的测试形式,并以更少的试错推进 TDD 工作流。

Skill 测试
收藏 0GitHub 156.2k
A
python-testing

作者 affaan-m

python-testing 帮助你以 pytest 优先的工作流来设计、编写和审查 Python 测试。可用于 TDD、fixtures、mocking、参数化、覆盖率检查,以及维护适用于 Skill Testing 和真实项目的可靠测试套件。

Skill 测试
收藏 0GitHub 156.2k
A
perl-testing

作者 affaan-m

perl-testing 是一份实用指南,介绍如何使用 Test2::V0、Test::More、prove、mocking、coverage 和 TDD 编写、运行并改进 Perl 测试。该 perl-testing 技能适合用于安装指导、使用模式、迁移帮助,以及更快排查测试套件失败问题。

Skill 测试
收藏 0GitHub 156.2k
A
kotlin-testing

作者 affaan-m

kotlin-testing 是一份面向 Kotlin 测试自动化的实用指南,涵盖 Kotest、MockK、协程测试、基于属性的测试和 Kover 覆盖率。使用这个 kotlin-testing 技能,可以遵循更贴近 TDD 的工作流,编写更清晰的单元测试和组件测试,并在 mock 依赖或测试挂起代码时减少猜测。

测试自动化
收藏 0GitHub 156.2k
A
golang-testing

作者 affaan-m

golang-testing skill 可帮助你编写并改进 Go 测试,涵盖表驱动用例、子测试、benchmark、fuzzing 以及覆盖率感知的 TDD。它面向正在处理真实 Go 代码、希望获得实用且符合 Go 习惯写法的指导,而不是泛泛而谈的测试建议的开发者。

测试自动化
收藏 0GitHub 156.2k
A
eval-harness

作者 affaan-m

eval-harness 技能是面向 Claude Code 会话和 eval 驱动开发的正式评估框架。它可以帮助你定义通过/失败标准,构建能力评估和回归评估,并在发布 prompt 或工作流变更前衡量 agent 的可靠性。

模型评测
收藏 0GitHub 156.1k
A
csharp-testing

作者 affaan-m

csharp-testing 是一份面向 C# 和 .NET 测试自动化的实用指南,涵盖 xUnit、FluentAssertions、mock、集成测试,以及适合长期维护的清晰测试结构,帮助你构建可维护的测试覆盖。

测试自动化
收藏 0GitHub 156.1k
A
cpp-testing

作者 affaan-m

cpp-testing 技能可帮助你使用 GoogleTest、GoogleMock、CMake 和 CTest 编写、运行并调试 C++ 测试。它适用于覆盖率分析、修复 flaky test、借助 sanitizer 进行诊断,以及在现代 C++ 项目中更高效地使用 cpp-testing。

测试自动化
收藏 0GitHub 156.1k
A
context-budget

作者 affaan-m

context-budget 技能会审计 Claude Code 在 agents、skills、rules 和 MCP servers 中的上下文使用情况。它能帮助识别臃肿内容、重复内容和高成本组件,并返回按优先级排序的清理建议。这个 context-budget 指南适合需要实际使用 context-budget 的场景,以及更大规模环境中的 Skill Testing。

Skill 测试
收藏 0GitHub 156.1k
O
writing-skills

作者 obra

writing-skills 是一份面向 Skill Authoring 的实用指南,用于以测试驱动的工作流创建、编辑和验证 agent skills。你可以快速了解关键文件、前置条件,以及如何处理压力场景、基线测试,并高效迭代简洁的 `SKILL.md`。

Skill 编写
收藏 0GitHub 121.9k
A
skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能,可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案,并借助仓库脚本和审查工具优化触发描述。

Skill 编写
收藏 2GitHub 105.1k
W
llm-evaluation

作者 wshobson

使用 llm-evaluation skill,为 LLM 应用、提示词、RAG 系统和模型变更设计可重复执行的评估方案,覆盖指标、人审、基准测试与回归检查。

模型评测
收藏 0GitHub 32.6k
G
agentic-eval

作者 github

agentic-eval 是一个 GitHub Copilot skill,展示如何通过反思、基于 rubric 的评审,以及 evaluator-optimizer 模式,为 AI 输出构建评估循环。

模型评测
收藏 0GitHub 27.8k
A
test-driven-development

作者 addyosmani

test-driven-development 技能帮助你通过先写一个会失败的测试,再做最小修改让它通过来改代码。适用于逻辑变更、修复 bug、回归问题和边界场景——当你更看重可验证的证据,而不是看起来合理的补丁时尤其合适。

Skill 测试
收藏 0GitHub 18.8k
M
context-fundamentals

作者 muratcankoylan

context-fundamentals 是一份面向 AI agent 系统的 context engineering 实用指南。它能帮助你判断哪些内容该放进 prompt,排查 context 问题,并通过更清晰的 context 结构管理 token 预算。当你需要一份扎实的 context-fundamentals 指南,用于 agent 设计和 prompt 优化时,就适合使用这项 context-fundamentals 技能。

上下文工程
收藏 0GitHub 15.6k
Y
skill-builder

作者 yusufkaraaslan

skill-builder 帮助 skill 作者借助 Skill Seekers,将文档、GitHub 仓库、PDF、视频和代码库转化为可供 AI 使用的 skills。它包含来源类型检测、推荐工作流以及基于工具的步骤,帮助你进行可重复的 skill 编写,而不是一次性提示词试验。

Skill 编写
收藏 0GitHub 13.5k
P
test-scenarios

作者 phuryn

test-scenarios 技能可将用户故事转化为可直接执行的测试场景,包含目标、起始条件、用户角色、步骤、预期结果和边界情况。它适用于 QA 测试用例、验收测试、功能验证,以及在需要结构化 test-scenarios 指南时帮助你设计更清晰的测试方案。

验收测试
收藏 0GitHub 11k
T
testing-handbook-generator

作者 trailofbits

testing-handbook-generator 是一个元技能,用于基于 Trail of Bits Testing Handbook(appsec.guide)创建 Claude Code skills。它帮助技能作者、安全工程师和维护者把手册章节转化为可复用的技能,并具备清晰的工作流、范围控制和可重复的生成流程。当你需要一份用于从 handbook 到 skill 编写的 testing-handbook-generator 指南时,就使用这个技能。

Skill 编写
收藏 0GitHub 5k
T
property-based-testing

作者 trailofbits

用于在多种语言和智能合约中编写、审查和改进 PBT 的 property-based-testing 技能指南。使用这份 property-based-testing 指南来识别 roundtrip、idempotence、invariant、parser、validator 和 normalization 场景,选择 generators,并判断何时 property-based-testing 比 example-based tests 更有优势。

Skill 测试
收藏 0GitHub 5k
D
create-skill-test

作者 dotnet

create-skill-test 用于为 dotnet/skills 中的 agent 技能搭建 eval.yaml 测试文件骨架。可用它来创建技能测试、定义场景、fixtures、断言和 rubric,并降低评测设计中的过拟合风险。它不适合用于运行现有测试、排查 validator 报错或编写 SKILL.md 文件。

Skill 测试
收藏 0GitHub 3k
M
skill-optimizer

作者 mcollina

skill-optimizer 帮助作者提升 AI 技能的激活率、清晰度和跨模型可靠性。适合用于 Skill Authoring:当技能已经写好却总是跟不对、触发条件不够明确、出现回归,或需要压缩上下文成本时使用。它支持基准测试循环、发布门禁,以及更高的使用一致性。

Skill 编写
收藏 0GitHub 1.8k
S
skill-judge

作者 softaworks

skill-judge 是一项用于审查和评分的技能,适合审计 AI 技能包和 SKILL.md 文件。它可帮助作者与维护者评估知识增量、激活清晰度、工作流质量以及发布准备度,并提供可落地的改进建议。

Skill 验证
收藏 0GitHub 1.3k
N
judge

作者 NeoLabHQ

Judge 是一个两阶段评估技能:先启动 meta-judge,再启动 judge 子代理,在隔离上下文、证据和明确标准下对作品打分。适合用于代码、写作、分析或 Skill Authoring 的仅报告式审查;当你需要一份站得住脚的 judge 指南,而不是随口给出的意见时,它尤其合适。

Skill 编写
收藏 0GitHub 982
Skill 测试 Agent Skill