test-driven-development

test-driven-development 技能帮助你通过先写一个会失败的测试，再做最小修改让它通过来改代码。适用于逻辑变更、修复 bug、回归问题和边界场景——当你更看重可验证的证据，而不是看起来合理的补丁时尤其合适。

Stars18.8k

收录时间2026年4月21日

分类Skill 测试

安装命令

npx skills add addyosmani/agent-skills --skill test-driven-development

编辑评分

这个技能评分为 84/100，说明它非常适合作为目录条目，面向想要 agent 友好型 TDD 工作流、且希望有清晰触发条件和分步指导的用户。它能帮助 agent 比通用提示词更少靠猜测地选择并执行该技能，但它仍然只是一个单文件技能，没有配套脚本或参考资料。

84/100

亮点

触发条件明确：说明直接指向新逻辑实现、bug 修复和行为变更，适合自动判断何时启用。
流程清晰可执行：它把 RED-GREEN-REFACTOR 循环以及适用与不适用的场景都讲明白了。
实用深度不错：正文内容较充实，包含多个标题、约束和代码示例，而不是占位文本。

注意点

没有配套支持文件或安装命令：用户只能拿到 SKILL.md，因此是否采用很依赖认真阅读文档。
被标记为 experimental/test 且缺少外部引用，所以可信度主要取决于内容本身，而不是工具链或引文。

测试问答 Development JavaScript TypeScript

概览

`test-driven-development` 技能概览

test-driven-development 技能的核心价值，是先用测试证明行为，再实现刚好能让测试通过的最小修复。它尤其适合开发者和智能体处理逻辑变更、bug 修复、边界情况以及回归问题——也就是那种“看起来没问题”远远不够的任务。如果你想借助 test-driven-development skill 来减少拍脑袋式修改，这份指南会告诉你它在什么场景最合适，以及它实际能带来什么：更安全的代码修改、更清晰的需求边界，以及首次提交后更少的返工。

这个技能适合解决什么问题

当任务会改变运行时行为时，就该考虑使用 test-driven-development：例如新增函数、修改判断条件、复现 bug，或任何可能悄悄破坏现有代码的改动。尤其是在仓库本身已经有测试的情况下，这个技能很有价值，因为它能让智能体在项目现有的“证明体系”里工作，而不是凭空猜测应该实现什么行为。

它和普通写代码方式有什么不同

它最关键的价值在于纪律性：先写一个失败的测试，再只实现测试已经证明需要的部分。这样做能给智能体一个非常明确的目标，尽早暴露隐藏假设，并把修复范围尽量收窄。对于 test-driven-development for Skill Testing 这类场景，这往往就是“看起来像是修好了”和“已经被验证修好了”的区别。

什么情况下不适合用

如果改动根本不涉及运行时行为，就不适合使用这个技能，比如文案修改、静态内容更新，或纯配置层面的微调。如果项目几乎没有测试覆盖，它依然可能有帮助，但落地会更慢，因为在这套工作流真正发挥价值之前，你可能得先把测试运行环境搭起来。

如何使用 `test-driven-development` 技能

安装并先检查技能内容

按照仓库的安装流程完成 test-driven-development install：

npx skills add addyosmani/agent-skills --skill test-driven-development

安装后，先从 SKILL.md 读起。在这个仓库里，没有额外的 rules/、resources/ 或 scripts/ 目录可供参考，所以最重要的工作就是认真读完这个技能文件，并把其中的方法映射到你自己的代码库里。

把模糊需求改写成可测试的提示词

高质量的 test-driven-development usage，起点应该是“行为描述”，而不是“直接要一个方案”。好的输入会像这样：“先为邮箱为空的校验补一个失败测试，再在 src/auth.ts 中实现最小修复。” 不够好的输入则像：“把登录做得更好。”
尽量明确可观察结果、已知的文件或模块，以及你最担心的回归风险。

按 RED-GREEN-REFACTOR 循环推进

把这个技能当成一套工作流来用：先写一个在当前代码下会失败的测试；再写最小代码改动让它通过；最后只在测试仍然通过的前提下做重构。如果失败场景很难稳定复现，不要急着改实现，先把测试用例打磨清楚。这个技能只有在“失败案例足够具体、足以证明 bug 存在”时，效果才最好。

先读对文件，再开始动手

对这个仓库来说，最应该优先读的是 SKILL.md。之后再检查你目标项目里的本地测试环境：测试运行器配置、现有测试约定，以及你计划修改代码附近的测试文件。如果项目已经有成熟的测试模式，就严格照着来；如果没有，就把测试写得尽量小、尽量明确。

`test-driven-development` 技能 FAQ

这是不是只适合有经验的工程师？

不是。初学者也可以用 test-driven-development，但前提是起点要足够清楚：一个行为、一个失败测试、一个最小修复。相比大范围的新功能开发，这个技能更适合拿小型 bug 修复来上手。

它和普通提示词有什么区别？

普通提示词通常只是要求代码“能工作”。这个技能要求的是“有证据证明它能工作”。test-driven-development guide 会推动智能体把“测试通过”定义为成功标准，从而减少歧义，也让代码评审更容易开展。

什么情况下不该选它？

如果是文档、格式调整，或者无法表达为运行时行为的改动，就跳过它。另一个不适合的场景是：项目根本没有可用的测试基础设施，而你又只需要一次很快的、非行为层面的修改。

`test-driven-development` 适用于所有技术栈吗？

原则上适用，但具体的测试命令、断言写法和文件结构，取决于你的技术栈。这个技能本身不绑定框架；你本地仓库的约定才决定你会使用 Jest、Vitest、pytest、JUnit，还是其他测试运行器。

如何提升 `test-driven-development` 技能的使用效果

给智能体一个更尖锐的失败案例

最有效的输入，应该明确指出失败行为、预期结果和边界条件。比如：“当 parseDate("") 执行时，应该抛出 InvalidDateError；先补测试，再修 parser。” 这样能帮助 test-driven-development skill 避免落入模糊实现猜测。

把现有测试风格一并说明清楚

可以主动提及附近的测试文件、命名模式，以及项目里已经在使用的 helpers 或 fixtures。如果仓库在类似行为上使用的是 table-driven tests、mocks 或 integration tests，也要直接说明。贴合本地约定，既能提升可信度，也更容易让产出顺利合并。

留意最常见的失败方式

最典型的错误包括：还没写测试就先写实现、写了一个本来就会通过的测试、以及把修复范围扩张到失败案例之外。如果第一轮输出改得太大，就明确要求“只写最小可失败测试，再给一个最小补丁”。这通常才是获得可靠 test-driven-development usage 的最快路径。

用证据推进迭代，而不是靠猜

第一轮完成后，继续要求下一个“证明点”：再补一个边界情况、加一个回归测试，或者做一次在测试通过前提下的重构。如果 bug 比较隐蔽，可以要求给出修改前后的行为摘要，以及需要新增的确切测试名称。这样整个工作流就会始终围绕可观察行为展开，而不是建立在主观假设之上。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

skill-creator

作者 anthropics

skill-creator 是一个用于 Skill 编写的元技能，可用于起草新技能、修改现有 `SKILL.md`、运行评测、对比不同方案，并借助仓库脚本和审查工具优化触发描述。

Skill 编写

收藏 2GitHub 105.1k

cpp-testing

作者 affaan-m

cpp-testing 技能可帮助你使用 GoogleTest、GoogleMock、CMake 和 CTest 编写、运行并调试 C++ 测试。它适用于覆盖率分析、修复 flaky test、借助 sanitizer 进行诊断，以及在现代 C++ 项目中更高效地使用 cpp-testing。

测试自动化

收藏 0GitHub 156.1k

skill-optimizer

作者 mcollina

skill-optimizer 帮助作者提升 AI 技能的激活率、清晰度和跨模型可靠性。适合用于 Skill Authoring：当技能已经写好却总是跟不对、触发条件不够明确、出现回归，或需要压缩上下文成本时使用。它支持基准测试循环、发布门禁，以及更高的使用一致性。

Skill 编写

收藏 0GitHub 1.8k

property-based-testing

作者 trailofbits

用于在多种语言和智能合约中编写、审查和改进 PBT 的 property-based-testing 技能指南。使用这份 property-based-testing 指南来识别 roundtrip、idempotence、invariant、parser、validator 和 normalization 场景，选择 generators，并判断何时 property-based-testing 比 example-based tests 更有优势。

Skill 测试

收藏 0GitHub 5k

writing-skills

作者 obra

writing-skills 是一份面向 Skill Authoring 的实用指南，用于以测试驱动的工作流创建、编辑和验证 agent skills。你可以快速了解关键文件、前置条件，以及如何处理压力场景、基线测试，并高效迭代简洁的 `SKILL.md`。

Skill 编写

收藏 0GitHub 121.9k

verification-loop

作者 affaan-m

verification-loop 是一个用于 Claude Code 的验证工作流，用来在代码变更后检查构建、类型、lint、测试、安全性和 diff。这个 verification-loop 技能很适合在发 PR 之前或重构之后使用，当你需要的是一套结构化的变更后检查指南，而不是一个泛泛的提示词时。

验证

收藏 0GitHub 156.3k

perl-testing

作者 affaan-m

perl-testing 是一份实用指南，介绍如何使用 Test2::V0、Test::More、prove、mocking、coverage 和 TDD 编写、运行并改进 Perl 测试。该 perl-testing 技能适合用于安装指导、使用模式、迁移帮助，以及更快排查测试套件失败问题。

Skill 测试

收藏 0GitHub 156.2k

kotlin-testing

作者 affaan-m

kotlin-testing 是一份面向 Kotlin 测试自动化的实用指南，涵盖 Kotest、MockK、协程测试、基于属性的测试和 Kover 覆盖率。使用这个 kotlin-testing 技能，可以遵循更贴近 TDD 的工作流，编写更清晰的单元测试和组件测试，并在 mock 依赖或测试挂起代码时减少猜测。

测试自动化

收藏 0GitHub 156.2k

eval-harness

作者 affaan-m

eval-harness 技能是面向 Claude Code 会话和 eval 驱动开发的正式评估框架。它可以帮助你定义通过/失败标准，构建能力评估和回归评估，并在发布 prompt 或工作流变更前衡量 agent 的可靠性。

模型评测

收藏 0GitHub 156.1k

context-budget

作者 affaan-m

context-budget 技能会审计 Claude Code 在 agents、skills、rules 和 MCP servers 中的上下文使用情况。它能帮助识别臃肿内容、重复内容和高成本组件，并返回按优先级排序的清理建议。这个 context-budget 指南适合需要实际使用 context-budget 的场景，以及更大规模环境中的 Skill Testing。

Skill 测试

收藏 0GitHub 156.1k

skill-judge

作者 softaworks

skill-judge 是一项用于审查和评分的技能，适合审计 AI 技能包和 SKILL.md 文件。它可帮助作者与维护者评估知识增量、激活清晰度、工作流质量以及发布准备度，并提供可落地的改进建议。

Skill 验证

收藏 0GitHub 1.3k

playwright-testing

作者 alinaqi

用于编写和调试 Playwright 端到端测试的 playwright-testing 技能，覆盖 page objects、跨浏览器运行、适合 CI 的配置、认证处理和稳定的测试结构。

Skill 测试

收藏 0GitHub 607

darwin-skill

作者 alchaincyf

darwin-skill 通过一个可重复的闭环来改进 SKILL.md 文件：先评估，再修订、测试，最后保留或回滚更改。它面向 Skill Authoring，将 rubric 评分与基于 prompt 的验证结合起来，并支持从 repo 模板和 assets 生成可视化结果输出。

Skill 编写

收藏 0GitHub 549

evaluation

作者 muratcankoylan

evaluation 技能可帮助你为非确定性系统设计并执行 agent 评估。适用于评估安装规划、评分标准、回归检查、质量门禁，以及 Skill Testing 场景下的评估；也适合 LLM-as-judge 工作流、多维度打分，以及需要可重复结果的实际评估使用。

Skill 测试

收藏 0GitHub 0

tutor

作者 RoundTable02

tutor 是一款面向 Obsidian StudyVault 用户的测验驱动学习技能，适合需要诊断性评估、概念级复习和进度追踪的人。它会识别语言、找到 vault、读取 dashboard，并通过结构化练习会话强化薄弱环节。需要可重复的学习检查，而不是通用聊天式 tutor 时，就用 tutor。

Skill 编写

收藏 0GitHub 0

skill-authoring-workflow

作者 deanpeters

skill-authoring-workflow 可帮助你把零散笔记、工作坊输出或草稿提示，整理成合规、可直接入库的 `skills/<skill-name>/SKILL.md`。使用这个 skill-authoring-workflow 技能，可以更少凭感觉来创建或更新 PM skills，遵循仓库规范，并在提交前完成校验。

Skill 编写

收藏 0GitHub 0

test-driven-development

test-driven-development 技能概览

这个技能适合解决什么问题

它和普通写代码方式有什么不同

什么情况下不适合用

如何使用 test-driven-development 技能

安装并先检查技能内容

把模糊需求改写成可测试的提示词

按 RED-GREEN-REFACTOR 循环推进

先读对文件，再开始动手

test-driven-development 技能 FAQ

这是不是只适合有经验的工程师？

它和普通提示词有什么区别？

什么情况下不该选它？

test-driven-development 适用于所有技术栈吗？

如何提升 test-driven-development 技能的使用效果

给智能体一个更尖锐的失败案例

把现有测试风格一并说明清楚

留意最常见的失败方式

用证据推进迭代，而不是靠猜

评分与评论

`test-driven-development` 技能概览

如何使用 `test-driven-development` 技能

`test-driven-development` 技能 FAQ

`test-driven-development` 适用于所有技术栈吗？

如何提升 `test-driven-development` 技能的使用效果