code-reviewer

作者 Shubhamsaboo

code-reviewer 是一款轻量级的 Code Review 技能，可将代码或 diff 转换为结构化报告，覆盖 security、performance、best practices、严重级别、受影响的行或区段、修复建议，以及整体质量评分。

Stars104.2k

收录时间2026年4月1日

分类代码评审

安装命令

npx skills add Shubhamsaboo/awesome-llm-apps --skill code-reviewer

编辑评分

该技能评分为 66/100，适合收录给想要轻量级代码审查提示框架的目录用户；但在核心检查清单和报告格式之外，实际操作深度相对有限，需要有相应预期。

66/100

亮点

触发场景定义清晰：适用于代码审查、安全审计、代码质量检查和 pull request。
提供了一个覆盖 security、performance 和 best practices 的简洁审查框架。
定义了包含 severity、位置、修复建议和总体评分的结构化输出格式，有助于智能体保持稳定一致的响应。

注意点

没有为 pull request、多文件审查或如何在通用检查清单之外深入检查代码提供具体工作流。
缺少示例、配套文件和约束说明，智能体可能需要额外提示，才能更稳定一致地应用审查结论。

Security Performance Code Style 开发者受众

概览

code-reviewer skill 概览

code-reviewer skill 是一个轻量级的审查提示模板，被封装成可复用的 skill，专门用于 Code Review 场景。它的职责很直接：接收一段代码、pull request diff 或单个文件，然后输出一份结构化的审查结果，重点关注安全问题、性能问题，以及通用工程最佳实践。

code-reviewer 最适合用在哪些场景

如果你需要一个快速的一轮审查器，并且希望它能稳定检查以下内容，那么 code-reviewer 会很合适：

安全漏洞，例如注入风险、XSS、硬编码密钥、不安全的数据处理
性能问题，例如冗余循环、内存隐患、错失缓存机会
可维护性问题，例如命名不清晰、错误处理薄弱、文档不足、违反 DRY 原则

它尤其适合以下人群和场景：开发者做 pull request 审查、排查可疑代码，或者把一套可重复执行的审查清单加入 AI 工作流。

它真正解决的是什么问题

大多数用户并不是想要一段泛泛而谈的“代码评价”，而是想得到一份可执行的审查结论，明确告诉他们：

问题是什么
严重程度如何
出现在哪
下一步该改什么

这正是 code-reviewer skill 的核心价值：它会把模型引导成“输出审查报告”，而不是生成一串没有结构、难以落地的评论。

为什么要选它，而不是直接写一个普通 prompt

code-reviewer skill 的主要差异点，不在于深度自动化，也不在于具备 repo 级别的感知能力，而在于它提供了一个稳定的审查框架。这个 skill 预先定义了：

审查维度
预期输出结构
严重级别模型
总体质量评分

如果你需要跨多个文件或多个 PR 反复做审查，这能有效降低 prompt 漂移，让输出更稳定。

这个 skill 不包含什么

这个仓库条目本身刻意保持极简。它只包含 SKILL.md；没有辅助脚本、规则文件、参考资料，也没有语言专属清单。这意味着，code-reviewer 更适合被当作一个可复用的审查模板，而不是完整的静态分析替代品，也不是面向特定框架的安全审计器。

如何使用 code-reviewer skill

在你的 skills 环境中安装 code-reviewer

如果你使用的是该仓库生态下的 Skills 工作流，可以通过下面的命令安装 code-reviewer：

npx skills add Shubhamsaboo/awesome-llm-apps --skill code-reviewer

安装完成后，最值得先看的主文件是：

SKILL.md

由于这个 skill 没有额外的支持文件，所以只要读这一份文件，你基本就能理解它的大部分行为。

依赖它之前，先读一遍 SKILL.md

SKILL.md 会明确告诉你模型会优先优化哪些维度：

Security
Performance
Best Practices
Output Format

这一点很关键，因为 code-reviewer guide 的能力上限，取决于它明确写出的审查维度。如果你的团队还关心并发、API 兼容性、测试覆盖率、可访问性，或者框架特有风险，那就需要在 prompt 里额外点明。

code-reviewer 需要什么输入

code-reviewer usage 的效果，很大程度上取决于你给它什么输入。更理想的输入包括：

一个聚焦的 pull request diff
单个文件，或一小组紧密相关的文件
足够的上下文，帮助理解数据流
使用的语言和框架
代码预期行为

较弱的输入示例：

“Review this code”，后面贴一整大段文件内容，但没有任何上下文

更强的输入示例：

“Review this Python FastAPI diff for security and performance. Focus on authentication, SQL handling, and error paths. This endpoint should only return the current user's records.”

把模糊需求变成高质量审查 prompt

一个模糊的目标通常会像这样：

“Check whether this is safe to merge.”

而一个更适合 code-reviewer for Code Review 的 prompt，通常应包含：

这段代码原本要做什么
改了什么
哪些风险最重要
你是只要 findings，还是希望 findings 加 patch 建议一起给出

示例 prompt 结构：

“Use code-reviewer on this Node.js PR diff. Prioritize SQL injection, secret leakage, and expensive repeated queries. For each issue, give severity, affected line/section, and a concrete fix. If no issue is found in an area, say so briefly.”

这种写法更有效，因为它既贴合 skill 内置的结构，又能把审查范围收窄到你真正关心的合并风险上。

pull request 的最佳工作流

一个实用的流程是：

先让 code-reviewer 只审 diff，而不是整个仓库。
第一轮只看 High 和 Critical 级别的问题。
对被标记的位置做人工复核。
第二轮再检查可维护性问题和较低严重级别的清理项。
如有需要，再针对最重要的问题要求给出 patch 风格修复建议。

这种分阶段方法，能避免真正重要的问题被大量样式类评论淹没。

单文件审计时的最佳工作流

如果是审单个文件或函数，可以这样做：

提供文件内容
说明输入、输出和信任边界
指出数据来自用户、数据库，还是第三方 API
要求 skill 追踪高风险路径

这一点在安全审查里尤其重要，因为 skill 只能基于你展示出来的代码做推理。

如何让它给出更准确的行级定位

这个 skill 会要求输出“具体出问题的行或区段”，但模型通常仍然需要一点辅助，才能更精确地定位。要提升这部分质量，可以：

尽量贴带行号的代码
控制 snippet 长度，保留结构清晰度
包含函数名或文件路径
在 diff 中清楚区分 old code 和 new code

如果你直接给一个巨大的、没有行号的文件，那它的位置引用通常会更弱。

code-reviewer 什么时候该看 diff，什么时候该看完整文件

以下情况更适合用 diff：

你想获得面向 merge 的反馈
你已经基本信任未改动代码
你需要快速分诊

以下情况更适合看完整文件：

当前改动依赖周边 helper
数据校验发生在别处
审查需要完整控制流上下文

对大多数团队来说，先看 diff，只在必要时再升级到完整文件，是信号最强的 code-reviewer usage 模式。

可以期待什么样的输出

这个 skill 设计出来的标准输出通常包括：

每个 finding 的 severity rating
涉及的行或区段
推荐修复方式
从 1 到 10 的整体代码质量评分

这样你就更容易把结果直接接到 PR 评论、内部检查清单，或者审查总结里，不用再手工重排格式。

安装前需要先知道的实际限制

在采用 code-reviewer 之前，你需要清楚它的边界：

它不会运行代码
它不会自动解析依赖关系
这个 repo 目录里没有语言专属 rule pack
如果缺少上下文，它无法验证报告中的问题是否真的会在生产环境触发

所以，正确用法是把它当成一个基于推理的审查器，然后用测试、linters 或安全工具去验证高影响问题。

code-reviewer skill 常见问题

code-reviewer 足够胜任生产级安全审查吗

不够。code-reviewer 很适合在早期暴露出“很可能存在”的安全问题，但它不能替代 SAST、dependency scanning、secret scanning，也不能替代对敏感代码的人审。它最适合作为正式审查之前的一道上游筛选，先把明显或高度可疑的问题提早抓出来。

code-reviewer skill 对新手友好吗

友好。它的结构很简单，除了你原本的 skills 环境外，不需要额外文件，也没有额外 setup 依赖。对新手来说，最大的难点其实是输入质量：prompt 越模糊，审查结果也越模糊。如果你能讲清楚代码应该做什么、信任边界在哪里，即使是新手，也能较快拿到有用输出。

code-reviewer 和直接让一个 LLM 审代码有什么区别

普通 prompt 往往会导致审查标准不稳定。code-reviewer skill 会把模型锚定在一套可重复的检查清单和输出格式上。你仍然需要提供上下文，但这个 skill 能明显降低回答跑题、啰嗦、缺乏优先级的概率。

code-reviewer 在什么情况下不太适合

如果你需要下面这些能力，就应该跳过 code-reviewer，或者至少重度补强：

面向特定框架的合规检查
跨大量文件的深度架构审查
精确的运行时行为验证
严格的语言惯用法约束
自动化代码修改

这个 skill 本来就刻意设计得足够通用、足够轻量，因此并不适合高度专业化的审计任务。

code-reviewer 能审非安全类的代码质量问题吗

可以。除了安全和性能，它也明确覆盖命名、错误处理、文档质量，以及 DRY 相关问题。如果你的首要目标是可维护性，而不是漏洞发现，它依然有价值；不过你最好在 prompt 里明确说明，这样反馈重心才会相应调整。

使用 code-reviewer 前，需要先读完整个仓库吗

不太需要。对这个 skill 来说，通常读 SKILL.md 就够了，因为没有 support folders、脚本或 metadata files 会实质性改变它的行为。如果你想快速采用，这种低门槛本身就是优势。

如何改进 code-reviewer skill

明确告诉 code-reviewer 你的风险模型

提升 code-reviewer 输出质量最快的方法，就是直接告诉它：你最在意哪类失败或风险：

auth bypass
injection
unsafe file access
expensive queries
race conditions
weak error handling

否则，它很可能把注意力平均分配到太多类别上，反而漏掉你真正关心的问题。

补上 skill 无法自行推断的上下文

请尽量提供：

language 和 framework
代码属于 backend、frontend 还是 infra
哪些输入是 trusted，哪些是 untrusted
性能预期
这是新代码，还是一次 regression check

和一味增加代码量相比，这些信息对 findings 质量的影响往往更大。

缩小审查单元

一个很常见的失败模式，是一次性让它审太多代码。审查单元越小，准确率通常越高，例如：

一个 diff
一个 endpoint
一个 service method
一个 config block

如果你直接贴整个子系统，输出往往会变得更泛，也更难验证。

要求只输出有证据支撑的 findings

如果你想减少幻觉式问题，可以在 prompt 里明确要求模型：

引用精确的代码路径或行范围
说明为什么从当前展示的代码来看，这个问题是成立或至少合理的
把“已确认观察”与“推测性担忧”分开

这样能让 code-reviewer 在真实审查工作流里更值得信任。

以正确的形式要求修复建议

如果你希望输出能快速落地，可以直接指定修复建议的形式，例如：

最小化 remediation steps
patch-style suggestions
更安全的替代模式
merge-blocker vs follow-up classification

虽然“Recommended fix”本来就是内置项，但你明确指定修复形式后，结果通常会更易用。

让严重级别和你们团队标准对齐

severity label 只有在和你们的合并标准一致时才真正有价值。想让 code-reviewer guide 更贴合你的工作流，可以明确告诉它下面这些级别分别意味着什么：

Critical：可立即利用，或存在数据丢失风险
High：大概率是真问题，必须在 merge 前修复
Medium：重要，但不会阻塞 merge
Low：清理项或可维护性问题

否则，它给出的 severity 看起来也许合理，但并不一定能映射到你们实际的审查策略。

第一轮审查后，再做一次有针对性的第二轮

拿到第一轮结果后，不要只追问一句“anything else?”。更有效的方式是进行定向追问，例如：

“Re-check only auth and session handling.”
“Now ignore style and focus on expensive database access.”
“Challenge your previous findings and remove weak ones.”
“Suggest tests that would validate the top two issues.”

这种方式比重复原始请求，更容易得到更锋利、更高价值的第二轮输出。

让 code-reviewer 和其他质量门禁一起工作

最佳采用方式，通常是把 code-reviewer install 和基于 prompt 的审查，与下面这些手段组合起来：

linters
test suites
type checks
dependency scanners
human PR review

这个 skill 能补上推理能力和优先级判断，但如果要自动验证事实，它仍然最适合与其他工具配合使用。

为你自己的团队定制改进这个 skill

正因为这个 skill 很轻量，所以也很容易扩展。如果你打算 fork 或自行改造，最值得优先做的增强通常是：

增加语言专属审查标准
增加框架专属安全检查
定义更清晰的 severity 规则
补充优质输入示例
为 PR review 和 full-file audit 分别设计独立模式

这些改动对输出质量的提升，通常会比单纯做文字层面的修饰更明显。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

security-threat-model

作者 openai

面向 AppSec 威胁建模的、基于仓库内容的 security-threat-model 技能。它会把信任边界、资产、攻击者目标、滥用路径和缓解措施整理成一份简洁的 Markdown 威胁模型。适用于你需要针对某个具体仓库或路径做 security-threat-model 威胁建模时，而不是做通用的架构评审或代码检查。

威胁建模

收藏 0GitHub 0

laravel-tdd

作者 affaan-m

laravel-tdd 是一份面向 Laravel 的测试驱动开发指南，覆盖 PHPUnit 和 Pest。它帮助你选择单元测试、功能测试和集成测试，制定数据库策略，使用 fake，并设定覆盖率目标，形成一套实用的测试自动化工作流。

测试自动化

收藏 0GitHub 156.2k

codeql

作者 trailofbits

codeql 技能可帮助你在安全审计中更少遗漏地运行 CodeQL。它重点关注数据库质量、suite 选择、数据扩展和 SARIF 审查，让你在受支持的语言中更可靠地使用 codeql。适合在分析真实仓库时执行可重复的 codeql 指南步骤。

安全审计

收藏 0GitHub 5k

semgrep-rule-creator

作者 trailofbits

semgrep-rule-creator 可为安全漏洞、缺陷模式、污点流检测和编码规范创建生产级 Semgrep 规则。在需要精确规则、测试用例和验证，而不是泛泛草稿时，安全审计工作应使用 semgrep-rule-creator 技能。

安全审计

收藏 0GitHub 5k

insecure-defaults

作者 trailofbits

insecure-defaults 技能可帮助识别 fail-open 配置模式——也就是软件在不安全设置下继续运行，而不是直接停止。适用于对生产代码、部署配置和密钥处理逻辑进行安全审计，帮助发现弱认证、硬编码密钥和过于宽松的默认配置。

安全审计

收藏 0GitHub 5k

constant-time-analysis

作者 trailofbits

constant-time-analysis 是一项安全审计技能，用于在加密代码中的定时侧信道风险变成可利用漏洞之前将其找出来。适合在检查 C、C++、Go、Rust、Swift、Java、Kotlin、PHP、JavaScript、TypeScript、Python 或 Ruby 时，审查是否存在依赖秘密数据的运算、分支、比较以及编译后的输出。

安全审计

收藏 0GitHub 5k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份实用的 React Native 性能优化指南，聚焦启动慢、掉帧、重渲染过重、内存泄漏、bundle 体积膨胀和动画卡顿等问题。适用于需要有证据支撑的修复方案，例如 Hermes、bridge 开销、FlashList、原生模块，或排查线上版本回归性能时使用。

性能优化

收藏 0GitHub 1.3k

linting-neostandard-eslint9

作者 mcollina

linting-neostandard-eslint9 用于帮助你为 JavaScript 和 TypeScript 搭建基于 neostandard 的 ESLint v9 flat config，包括从 .eslintrc* 或 standard 迁移。这个 linting-neostandard-eslint9 技能适合用于安装、使用以及面向仓库落地的指引，覆盖 eslint.config.js 或 eslint.config.mjs，以及 CI 和编辑器集成。

代码编辑

收藏 0GitHub 0

rails-conventions

作者 ethos-link

rails-conventions 是一项实用的 Rails 8.x 技能，适用于构建和审查生产级后端代码。可用它来贴合本地约定，覆盖 model、controller、route、Hotwire、job、API、测试、安全和性能等方面。它尤其适合后端开发场景：rails-conventions 指南应当遵循应用现有模式，而不是套用通用默认值。

后端开发

收藏 0GitHub 0

github-pr-review

作者 fvadicamo

github-pr-review 是一项用于 GitHub PR 审查的 skill，可收集行内评论、PR 级别的 review 正文和回复，并按严重程度整理反馈，帮助你优先修复阻塞项。可用于处理 PR 评论、回复审查者，并通过针对性提交和线程回复更新分支。它适用于带身份验证的 GitHub CLI 工作流中的 github-pr-review 指南。

PR 评审

收藏 0GitHub 0

autofix

作者 coderabbitai

autofix 可安全地将 CodeRabbit 的 PR review thread 反馈转化为当前 GitHub 分支上的已验证代码改动。当你需要面向分支、支持明确审批的 CodeRabbit Code Review 工作流，而不是一个通用的按提示修修补补工具时，就该使用这个 autofix skill。它会检查仓库状态、读取可信指令，并且只应用经过验证的修复。

代码评审

收藏 0GitHub 0

security-ownership-map

作者 openai

使用 security-ownership-map 分析 git 历史中的安全所有权风险、巴士因子以及敏感代码归属。它可以将人员映射到文件，找出无人认领或归属不足的区域，并导出用于图分析的 CSV/JSON。最适合安全审计问题、CODEOWNERS 真实性核对，以及基于提交历史识别所有权集群。

安全审计

收藏 0GitHub 0

frontend-design-review

作者 microsoft

frontend-design-review 是一个 GitHub skill，用于评审前端 UI 工作，并从零构建有辨识度、可直接用于生产的界面。它可以帮助判断设计系统是否一致、可访问性是否达标、视觉质量是否过关，以及一个界面是显得通用，还是具有明确设计意图。适用于 PR 评审、组件评审，以及用于 UI Design 的 frontend-design-review。

UI 设计

收藏 0GitHub 0

sarif-parsing

作者 trailofbits

sarif-parsing 是一个扫描后的技能，用于读取、筛选、去重、汇总并转换来自 CodeQL、Semgrep 等工具的 SARIF 2.1.0 结果。适合你已经拿到扫描输出，并需要清晰的解析、聚合或面向 CI/CD 的转换时使用。它不用于执行扫描。

代码编辑

收藏 0GitHub 5k

property-based-testing

作者 trailofbits

用于在多种语言和智能合约中编写、审查和改进 PBT 的 property-based-testing 技能指南。使用这份 property-based-testing 指南来识别 roundtrip、idempotence、invariant、parser、validator 和 normalization 场景，选择 generators，并判断何时 property-based-testing 比 example-based tests 更有优势。

Skill 测试

收藏 0GitHub 5k

investigate

作者 garrytan

investigate 技能用于指导对故障、偶发性问题或异常行为进行系统化排查和根因分析。适用于代码评审、事故分诊、缺陷修复，以及“昨天还好好的”这类场景——当你需要先拿到证据再改代码时，它尤其有用。它遵循四阶段工作流：investigate、analyze、hypothesize、implement。

代码评审

收藏 0GitHub 91.8k