code-review-and-quality

作者 addyosmani

code-review-and-quality 是一项用于合并前评审的结构化技能，重点检查正确性、可读性、架构、安全性和性能。你可以从父仓库安装，阅读 `skills/code-review-and-quality/SKILL.md`，并结合 diff、任务上下文和测试结果使用，以支持更可靠的评审判断。

Stars18.7k

收录时间2026年4月21日

分类代码评审

安装命令

npx skills add addyosmani/agent-skills --skill code-review-and-quality

编辑评分

这项技能评分为 78/100，属于表现扎实的目录条目：它为 agent 提供了清晰的触发场景和较完整的评审框架，相比笼统的“review this code”提示，能明显减少判断上的猜测；不过用户也应预期，这更偏向依赖文档执行的技能，而不是由工具直接驱动的工作流。

78/100

亮点

触发场景明确：frontmatter 和“何时使用”部分清楚地将它定位为适用于合并前评审、功能完成后的复审、重构检查以及 bug 修复验证。
实践指导较充实：该技能定义了一个覆盖五个维度的评审模型（正确性、可读性、架构、安全性、性能），并给出批准建议，重点是提升整体代码健康度，而非苛求绝对完美。
对 agent 的复用价值高：较长且结构化的 `SKILL.md` 包含大量标题和代码块，为 agent 提供了稳定、清单式的评审框架，可从多个维度一致地审查代码。

注意点

未提供安装命令、脚本或配套支持文件，因此实际执行更依赖 agent 对文字说明的理解，而不是调用明确的工作流。
从仓库现有内容看，除 `SKILL.md` 外，实操性产物相对有限，这可能使输出格式、优先级判断以及针对具体仓库的适配方式留有一定开放空间。

Pr 问答测试 Quality

概览

code-review-and-quality 技能概览

code-review-and-quality 技能是做什么的

code-review-and-quality skill 是一套用于合并前代码检查的结构化评审流程。它不是简单给出一句笼统的“review this PR”，而是要求 agent 从五个明确维度审查变更：correctness、readability、architecture、security 和 performance。正因为评审框架足够具体，所以它更适合需要“可直接做合并决策”的评审场景，而不只是零散评论。

谁适合安装

最适合的人群是：经常通过 PR 交付代码的工程师、技术负责人，以及使用 AI 辅助编码、希望建立可重复质量门禁的用户。尤其是在以下场景中，它的价值会更明显：代码由另一个 agent 编写、bug fix 需要重点检查回归风险，或者某次重构表面看起来“很干净”，但可能隐藏了正确性或设计层面的退化。如果你主要只是想做风格层面的 linting，那这个 skill 覆盖的范围会更广。

用户真正关心的是什么

大多数在评估 code-review-and-quality skill 的用户，真正关心的通常是三点：它能不能抓到真实风险、会不会拦得太多，以及能不能适配普通仓库。它最有区分度的一点，在于批准标准比较务实：只要这次改动明显改善了代码健康度，即使不完美，也可以 approve。相比那些过度放大个人偏好的 review prompt，这种判断标准在实际工程里更好用。

它不能替代什么

这个 skill 本身不是静态分析器、测试执行器，也不是策略引擎。它能提升评审质量，但仍然依赖你提供的代码、diff、任务上下文、测试结果和项目约定。如果你没有给出预期行为、影响文件或已知约束，那么最终评审的可靠性会低于这套工作流表面上看起来的效果。

如何使用 code-review-and-quality 技能

安装时先看什么，以及从哪里开始读

如果要完成 code-review-and-quality install，先把上层 skill repo 加到支持 skills 的环境中，然后优先打开 skills/code-review-and-quality/SKILL.md。从仓库结构看，这个 skill 基本是自包含的：skill 目录下没有额外的 rules/、resources/ 或辅助脚本，所以主文档本身就是核心实现。正式调用前，建议先把 overview、when to use，以及五维评审这几部分完整读一遍，不要直接松散地调用。

想让评审靠谱，输入信息需要给到什么程度

code-review-and-quality usage 的效果高度依赖输入质量。至少应提供：

diff 或变更文件
原始任务、issue 或 acceptance criteria
使用的语言 / framework
测试状态或失败用例
任何不明显但很关键的约束，比如 backwards compatibility、latency budgets 或 security requirements

一个比较弱的提示是：“Review this code.”
更强的写法是：“Use the code-review-and-quality skill to review this auth PR. Focus on correctness, security, and regression risk. Here is the diff, expected login behavior, known edge cases, and current test output. Separate must-fix issues from non-blocking suggestions.”

如何把模糊目标写成完整 prompt

一个好用的 code-review-and-quality guide prompt，不应只让它列问题，还应要求给出合并建议。实用模板通常包括：

改了什么
为什么改
什么才算“正确”的行为
五个维度里这次要优先看什么
输出格式：blockers、warnings、suggestions、approval recommendation

示例：
“Use code-review-and-quality for Code Review on this payment retry change. Review across correctness, readability, architecture, security, and performance. Prioritize correctness and idempotency. Check whether tests cover retry limits and duplicate charge prevention. Return: 1) blockers, 2) non-blocking improvements, 3) approve / approve with changes / do not approve.”

实际工作流怎么接，以及怎样让输出更有用

这个 skill 最适合在实现完成后、合并之前使用，而不是等问题暴露后才补做评审。一个实用工作流是：

收集 diff、任务说明和测试结果。
调用 skill，并明确各维度优先级。
针对任何 blocker 继续追问。
修改代码。
用同一套 review prompt 对更新后的 diff 再跑一次。

如果你要求 agent 针对每条发现都标出 file path、function、edge case 和缺失测试，最终质量通常会明显更高。这样可以避免空泛评语，让反馈在真实 PR 里更容易直接落地。

code-review-and-quality 技能 FAQ

code-review-and-quality 比普通 review prompt 更好吗？

通常是的，尤其当你的核心问题是评审深度不稳定时。它的价值不在于“神奇分析能力”，而在于强制覆盖的评审模型。普通 prompt 往往会过度聚焦风格问题，或者只抓最容易挑刺的地方。需要在 correctness、maintainability、security 和 performance 之间取得平衡时，code-review-and-quality skill 会更强。

适合初学者吗？

适合，但有一个前提：初学者需要比自己预想中提供更多上下文。没有 acceptance criteria 或预期行为时，评审结果可能看起来很自信，却漏掉真正和业务相关的问题。对于初级团队，这个 skill 最适合作为“有清单支撑的 reviewer”，而不是唯一的 merge authority。

什么情况下它不太适合？

如果你只需要 formatter 级别的反馈、单一维度审计，或者自动化策略检查，就可以跳过 code-review-and-quality。另外，对于那种改动很大、又没有清晰 spec 的变更，它也不算理想选择，因为任务本身一旦含糊，评审质量就会明显下降。更好的做法是先把改动拆成更小、可评审的单元。

它能跨语言、跨仓库使用吗？

可以，因为它的框架是概念性的，不是语言专属的。但生态差异仍然重要：React app、Go service 和 Python data pipeline 对 architecture 的期待并不一样。你提供的 repo 约定越具体，评审就越能贴合本地标准，而不是落回泛泛而谈的 best practices。

如何改进 code-review-and-quality 技能

想提升 code-review-and-quality，给更强证据比堆形容词更有效

最大的提升点在输入质量。对 code-review-and-quality 来说，说一句“be thorough”，远不如直接提供：

精确的变更文件
预期输出
已知 edge cases
已添加或缺失的测试
项目里真正重要的约定

如果你想减少 false positives，就明确告诉 agent 哪些内容是刻意不在本次范围内的。如果你想让评审更深入，就直接点名高风险区域，例如 concurrency、authorization、migrations、caching 或 external API handling。

避免常见失效模式

这类 skill 的常见失效模式其实很固定：过度强调风格、漏掉领域约束、安全建议停留在表层，以及给出的建议无视项目现有模式。应对方式是要求 skill 明确区分：

客观缺陷 vs 偏好问题
merge blockers vs cleanup ideas
局部代码味道 vs 系统级 architecture 风险

这种 framing 和它的核心理念是一致的：重点是“改善代码库”，而不是“追求绝对完美”。

第一次评审后继续迭代

不要停在第一轮。如果最初的 code-review-and-quality usage 输出比较泛，可以继续追问，例如：

“Which findings are most likely to cause production bugs?”
“Which concerns are unsupported by the diff?”
“What test cases would prove or disprove your top two blockers?”
“Re-review after these fixes and tell me what risk remains.”

这样一来，这个 skill 就不再只是一次性清单，而会变成一个持续迭代的 review loop。

让批准标准和团队实际策略对齐

要进一步提升 code-review-and-quality skill 的实用性，关键是把批准阈值和团队真实的合并策略对齐。这个 skill 的核心判断标准其实很合理：只要代码实质性改善了健康度，即使不完美，也可以批准。你可以进一步强化这一点，要求最终结论按三档输出：safe to merge、merge after fixes，或 needs redesign。这样评审结果会更贴近真实交付决策，而不是沦为无休止的评论堆积。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

security-threat-model

作者 openai

面向 AppSec 威胁建模的、基于仓库内容的 security-threat-model 技能。它会把信任边界、资产、攻击者目标、滥用路径和缓解措施整理成一份简洁的 Markdown 威胁模型。适用于你需要针对某个具体仓库或路径做 security-threat-model 威胁建模时，而不是做通用的架构评审或代码检查。

威胁建模

收藏 0GitHub 0

laravel-tdd

作者 affaan-m

laravel-tdd 是一份面向 Laravel 的测试驱动开发指南，覆盖 PHPUnit 和 Pest。它帮助你选择单元测试、功能测试和集成测试，制定数据库策略，使用 fake，并设定覆盖率目标，形成一套实用的测试自动化工作流。

测试自动化

收藏 0GitHub 156.2k

codeql

作者 trailofbits

codeql 技能可帮助你在安全审计中更少遗漏地运行 CodeQL。它重点关注数据库质量、suite 选择、数据扩展和 SARIF 审查，让你在受支持的语言中更可靠地使用 codeql。适合在分析真实仓库时执行可重复的 codeql 指南步骤。

安全审计

收藏 0GitHub 5k

semgrep-rule-creator

作者 trailofbits

semgrep-rule-creator 可为安全漏洞、缺陷模式、污点流检测和编码规范创建生产级 Semgrep 规则。在需要精确规则、测试用例和验证，而不是泛泛草稿时，安全审计工作应使用 semgrep-rule-creator 技能。

安全审计

收藏 0GitHub 5k

insecure-defaults

作者 trailofbits

insecure-defaults 技能可帮助识别 fail-open 配置模式——也就是软件在不安全设置下继续运行，而不是直接停止。适用于对生产代码、部署配置和密钥处理逻辑进行安全审计，帮助发现弱认证、硬编码密钥和过于宽松的默认配置。

安全审计

收藏 0GitHub 5k

constant-time-analysis

作者 trailofbits

constant-time-analysis 是一项安全审计技能，用于在加密代码中的定时侧信道风险变成可利用漏洞之前将其找出来。适合在检查 C、C++、Go、Rust、Swift、Java、Kotlin、PHP、JavaScript、TypeScript、Python 或 Ruby 时，审查是否存在依赖秘密数据的运算、分支、比较以及编译后的输出。

安全审计

收藏 0GitHub 5k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份实用的 React Native 性能优化指南，聚焦启动慢、掉帧、重渲染过重、内存泄漏、bundle 体积膨胀和动画卡顿等问题。适用于需要有证据支撑的修复方案，例如 Hermes、bridge 开销、FlashList、原生模块，或排查线上版本回归性能时使用。

性能优化

收藏 0GitHub 1.3k

linting-neostandard-eslint9

作者 mcollina

linting-neostandard-eslint9 用于帮助你为 JavaScript 和 TypeScript 搭建基于 neostandard 的 ESLint v9 flat config，包括从 .eslintrc* 或 standard 迁移。这个 linting-neostandard-eslint9 技能适合用于安装、使用以及面向仓库落地的指引，覆盖 eslint.config.js 或 eslint.config.mjs，以及 CI 和编辑器集成。

代码编辑

收藏 0GitHub 0

rails-conventions

作者 ethos-link

rails-conventions 是一项实用的 Rails 8.x 技能，适用于构建和审查生产级后端代码。可用它来贴合本地约定，覆盖 model、controller、route、Hotwire、job、API、测试、安全和性能等方面。它尤其适合后端开发场景：rails-conventions 指南应当遵循应用现有模式，而不是套用通用默认值。

后端开发

收藏 0GitHub 0

github-pr-review

作者 fvadicamo

github-pr-review 是一项用于 GitHub PR 审查的 skill，可收集行内评论、PR 级别的 review 正文和回复，并按严重程度整理反馈，帮助你优先修复阻塞项。可用于处理 PR 评论、回复审查者，并通过针对性提交和线程回复更新分支。它适用于带身份验证的 GitHub CLI 工作流中的 github-pr-review 指南。

PR 评审

收藏 0GitHub 0

autofix

作者 coderabbitai

autofix 可安全地将 CodeRabbit 的 PR review thread 反馈转化为当前 GitHub 分支上的已验证代码改动。当你需要面向分支、支持明确审批的 CodeRabbit Code Review 工作流，而不是一个通用的按提示修修补补工具时，就该使用这个 autofix skill。它会检查仓库状态、读取可信指令，并且只应用经过验证的修复。

代码评审

收藏 0GitHub 0

security-ownership-map

作者 openai

使用 security-ownership-map 分析 git 历史中的安全所有权风险、巴士因子以及敏感代码归属。它可以将人员映射到文件，找出无人认领或归属不足的区域，并导出用于图分析的 CSV/JSON。最适合安全审计问题、CODEOWNERS 真实性核对，以及基于提交历史识别所有权集群。

安全审计

收藏 0GitHub 0

frontend-design-review

作者 microsoft

frontend-design-review 是一个 GitHub skill，用于评审前端 UI 工作，并从零构建有辨识度、可直接用于生产的界面。它可以帮助判断设计系统是否一致、可访问性是否达标、视觉质量是否过关，以及一个界面是显得通用，还是具有明确设计意图。适用于 PR 评审、组件评审，以及用于 UI Design 的 frontend-design-review。

UI 设计

收藏 0GitHub 0

sarif-parsing

作者 trailofbits

sarif-parsing 是一个扫描后的技能，用于读取、筛选、去重、汇总并转换来自 CodeQL、Semgrep 等工具的 SARIF 2.1.0 结果。适合你已经拿到扫描输出，并需要清晰的解析、聚合或面向 CI/CD 的转换时使用。它不用于执行扫描。

代码编辑

收藏 0GitHub 5k

property-based-testing

作者 trailofbits

用于在多种语言和智能合约中编写、审查和改进 PBT 的 property-based-testing 技能指南。使用这份 property-based-testing 指南来识别 roundtrip、idempotence、invariant、parser、validator 和 normalization 场景，选择 generators，并判断何时 property-based-testing 比 example-based tests 更有优势。

Skill 测试

收藏 0GitHub 5k

investigate

作者 garrytan

investigate 技能用于指导对故障、偶发性问题或异常行为进行系统化排查和根因分析。适用于代码评审、事故分诊、缺陷修复，以及“昨天还好好的”这类场景——当你需要先拿到证据再改代码时，它尤其有用。它遵循四阶段工作流：investigate、analyze、hypothesize、implement。

代码评审

收藏 0GitHub 91.8k