performance-engineer

作者 zhaono1

performance-engineer 是一项结构化技能，用于定位性能瓶颈、分析慢系统，并借助基线指标、参考资料和辅助脚本验证修复效果。

Stars26

收录时间2026年3月31日

分类性能优化

安装命令

npx skills add zhaono1/agent-playbook --skill performance-engineer

编辑评分

这项技能评分为 76/100，说明它是一个表现扎实的目录收录候选：用户可以获得清晰的性能排查流程、明确的触发短语，以及一些可复用产物。但也要预期，实际使用时需要结合自身技术栈调整，而不是照着一套高度成型的端到端方案直接套用。

76/100

亮点

触发性很强：`SKILL.md` 明确会在性能投诉、优化请求，以及“slow”“latency”等相关表述出现时激活。
实用的操作框架：该技能提供分阶段分析步骤、常见瓶颈层次、性能目标，以及配套的检查清单和参考说明。
比通用提示词更有抓手：附带脚本可生成性能分析/Profile/报告模板，让代理在排查过程中有更具体的输出结构可用。

注意点

执行层面的指导对不同技术栈来说相对通用；虽然示例提到了 Node、Python 和 Go 的 profiling，但针对特定环境该如何选策略，明确的决策规则还不多。
配套脚本本质上是模板生成器，而不是真正的 profiler 或 benchmark runner，因此用户仍需要自行准备工具链和测量环境。

Performance Monitoring Metrics Reliability Python Cli

概览

performance-engineer 技能概览

performance-engineer 技能能做什么

performance-engineer 是一套聚焦于排障与优化的工作流，用来诊断系统变慢、定位瓶颈，并把“这个 endpoint 很慢”这类模糊抱怨转化为可度量、可验证的改进。它面向的是性能优化场景，而不是通用代码审查；它的核心价值在于强制你遵循“建立基线 → 测量 → 分析 profile → 验证结果”的闭环，而不是凭感觉猜问题。

谁适合使用 performance-engineer

这个技能适合开发者、SRE、后端工程师，以及已经有待排查系统的 AI-agent 用户。尤其适用于这类情况：你已经有一个可观察的系统，希望更快收敛到时间、内存或吞吐到底损失在什么地方；你手头有可复现的性能下降、明确的延迟目标，或已有怀疑的热点，但不想从一个空白提示词开始。

它真正解决的工作问题

大多数用户想要的并不只是“让代码更快”。他们通常需要回答这些更实际的问题：

到底是哪项指标出了问题？
瓶颈是在 database、API、frontend、network，还是 runtime？
在改代码之前，应该先测什么？
怎么证明优化确实有效，而且没有引入行为回退？

performance-engineer 最擅长的，就是把这类调查过程组织清楚。

为什么它和普通提示词不一样

普通提示词往往会直接跳到“可能的修复方案”。而 performance-engineer 更适合性能优化，是因为它会明确把重点放在：

基线指标和目标值
先做 profiling 再做优化
按层定位瓶颈
修改后的验证
来自 scripts/ 的轻量报告与 profiling 模板

这让它更像真实工程中的工作方法，而不只是生成一些点子。

安装前先确认什么

如果你能提供以下信息，这个技能会很适合你：

可供检查的代码库或 endpoint
可复现的慢路径
至少一个可量化的性能目标
允许运行 profiling、日志或 benchmark 命令

如果你的问题主要是正确性、架构选型，或者在没有任何性能症状时做成本预估，那它的适配度就会弱很多。

如何使用 performance-engineer 技能

如何安装 performance-engineer

通过仓库集合安装：

npx skills add https://github.com/zhaono1/agent-playbook --skill performance-engineer

如果你想在安装前先评估这个技能，建议先查看：

skills/performance-engineer/SKILL.md
skills/performance-engineer/README.md
skills/performance-engineer/references/checklist.md
skills/performance-engineer/references/monitoring.md
skills/performance-engineer/references/optimization.md
skills/performance-engineer/scripts/profile.py
skills/performance-engineer/scripts/perf_report.py

performance-engineer 技能需要哪些输入

performance-engineer 在你提供的是“运行上下文”而不仅仅是代码时，效果最好。比较强的输入包括：

具体变慢的 endpoint、query、page、job 或 command
当前值与目标值：latency、throughput、memory 或 CPU
环境细节，例如 language、framework、runtime 和 infra
问题如何复现
现有的 profiler 输出、trace 或日志
你怀疑的层：DB、API、frontend、network、caching 或 compute

如果没有这些信息，这个技能仍然可以给出流程建议，但输出质量会下降，因为它需要自行推断的内容太多。

把模糊需求变成高质量提示词

弱一点的写法：

Optimize this code.

更好的写法：

Use the performance-engineer skill on this Python API endpoint. Current p95 latency is 1.4s, target is under 500ms. Traffic spikes at 50 concurrent requests. We use PostgreSQL and Redis. Please identify what to measure first, likely bottlenecks, profiling commands to run, and the order of fixes to test.

为什么这样更好：

它定义了指标
它给出了目标值
它说明了负载形态
它缩小了可能的瓶颈层范围
它要求的是“调查顺序”，而不是随机给优化建议

实际使用中推荐的 workflow

一个比较好的 performance-engineer usage 模式是：

定义受影响的用户路径或系统操作。
记录基线指标。
对慢路径做 profiling 或检查。
把发现映射到可能的瓶颈层。
优先提出影响大、改动最小的修复。
每次修改后重新测量。
记录结论和回归检查项。

这和技能自身的阶段结构一致，能让优化过程始终建立在证据之上。

优先阅读哪些仓库文件

如果你想以最快路径上手，建议按这个顺序阅读：

SKILL.md：看激活信号和分析阶段
references/checklist.md：掌握最低限度的流程纪律
references/optimization.md：了解常见优化杠杆
references/monitoring.md：看上线后该追踪什么
README.md：查看示例目标和辅助脚本

这些 scripts 本身不是 profiler；它们是帮助你标准化调查输出的模板工具。

支持使用的内置脚本

有两个辅助脚本，能给这份 performance-engineer guide 带来很强的实操价值：

python scripts/profile.py 会生成一个 profile 模板，包含 environment、workload 和 hotspot 等字段。
python scripts/perf_report.py 会生成 markdown 报告，覆盖 summary、ownership、baseline metrics、findings、recommendations 和 validation。

示例：

python scripts/profile.py --name "checkout latency" --tool "cProfile" --command "python app.py" --duration "60s"
python scripts/perf_report.py --name "checkout API" --owner "payments-team"

如果你想要的是可复用的调查记录，而不是一次性的聊天输出，这两个脚本会很有帮助。

这个技能擅长发现什么问题

源材料把用户引导到一些常见瓶颈位置，例如：

database 问题，例如 N+1 queries、缺失索引或结果集过大
API 过度取数或序列化低效
通过 profiler 输出发现的 runtime 热点
payload 和 network 效率问题
热路径上的 caching 缺口

这意味着，当你真的有一个需要被定位的瓶颈时，这个技能最有价值；如果只是笼统地想“把所有东西都变快”，它反而没那么适合。

为了得到更好结果的实用提示词模板

在调用 performance-engineer for Performance Optimization 时，可以用这个结构：

Use the performance-engineer skill.

System:
- Service/page/job:
- Language/framework:
- Infra/dependencies:

Problem:
- Symptom:
- Current metric:
- Target metric:
- Reproduction steps:

Evidence:
- Logs/traces/profile snippets:
- Suspected bottleneck layer:

Task:
- Define measurement plan
- Identify likely root causes
- Recommend ordered fixes
- Specify how to validate improvement

和一句简单的“why is this slow?” 相比，这种提示词通常能产出更可执行的结果。

常见的采用障碍

在你真正依赖 performance-engineer install 之前，需要先了解几个主要限制：

它不能替代真正的 profiler 或 APM 工具
它必须基于可度量的症状才能高效工作
如果 workload 无法复现，它能提供的帮助会明显变少
如果你不给出 benchmark 路径，它也无法验证收益

换句话说，这个技能提升的是调查方法，不会凭空生成可信的测量结果。

什么情况下用普通提示词更合适

如果你只是想快速做代码风格清理、在一个很小的脚本里做微优化，或者只需要语言层面的调优建议而不想走完整调查流程，那么普通提示词可能就足够了。只有当问题影响更大、你需要一条从症状走到已验证修复的结构化路径时，performance-engineer skill 才更值得用。

performance-engineer 技能 FAQ

performance-engineer 适合新手吗？

适合，但前提是这个新手手上已经有一个明确的变慢场景。这个技能会提供一套有纪律的顺序——基线、profile、瓶颈、验证——帮助你避免过早优化。但如果你希望它从零开始系统讲清 observability 或 benchmarking 的全部基础，那它就没那么友好了。

为什么 performance-engineer 比直接让 AI 优化代码更好？

主要差别在于流程控制。普通提示词常常会立刻建议加 caching、补索引、改 async，或者直接重构。performance-engineer skill 更适合这样的情况：你首先需要判断问题到底在 database、API 层、memory 行为、payload 大小，还是 runtime 热点。

这个技能自带真实工具吗？

部分具备。仓库里包含 scripts/profile.py 和 scripts/perf_report.py 这样的模板生成器，也有 checklist、monitoring 和 optimization levers 的参考文档。但真正的 runtime profilers、日志、benchmark，以及和环境相关的命令，仍然需要你自己提供。

performance-engineer 只适用于后端服务吗？

不是。README 中的性能目标既包括 API，也包括 page-load 风格的指标，参考文档里也提到了 payload 和 network 效率。不过整体示例还是更偏向应用和服务排查，而不是深入的 frontend rendering 分析。

什么情况下不该使用 performance-engineer？

以下情况建议跳过：

目前还没有可度量的性能问题
你只是想做宽泛的架构 brainstorming
问题核心是可靠性或正确性，而不是速度
你无法复现 workload，也采集不到任何指标

在这些场景里，这个技能的结构化流程带来的价值会小很多。

performance-engineer 能帮助修复后的监控吗？

可以。references/monitoring.md 会推动用户关注 percentiles、throughput、error rates，以及针对回退的告警。如果你希望这个技能不仅帮助你做一次性调优，还能支持 rollout 后的验证，它就很有用。

如何改进 performance-engineer 技能的使用效果

提供更好的基线，而不是更长的提示词

提升 performance-engineer usage 效果最快的方法，是直接提供：

当前 p50、p95 或 p99 latency
throughput 和 error rate
memory 或 CPU 症状
精确的 benchmark 或 request path
优化前后对比计划

这些信息的价值，通常比补一大段叙述背景更高。

补充环境和 workload 形态

性能建议会随着 workload 不同而变化。告诉这个技能：

request concurrency
dataset size
cache warm 还是 cold
CPU 和 memory 限制
是 local、staging 还是 production 环境

仓库自带的 scripts/profile.py 模板就很好地提醒了你应该记录什么：environment、workload、command、duration 和 hotspots。

明确要求“排序后的修复建议 + 验证步骤”

一个很强的追加提示词是：

Use the performance-engineer skill to rank the top three likely bottlenecks by expected impact and confidence. For each, give the measurement to confirm it, the smallest fix to test, and the benchmark to verify improvement.

这样能显著减少“什么都试试看”的模糊输出，也能让后续迭代成本更低。

避开常见失败模式

用户从 performance-engineer 得到较弱结果，最常见的原因是：

没有基线指标
没有可复现的 workload
没有 profiler 或 trace 证据
还没隔离瓶颈就先要求修复方案
把多个系统混成一个模糊请求一起问

如果你第一次得到的结果很泛，多半就是这里面缺了某一项。

把 checklist 当成质量闸门

references/checklist.md 很短，但非常关键。可以把它当作最低标准：

已记录基线指标
已识别瓶颈
已用 benchmark 验证修复
已补充回归测试

也正是在这份 checklist 上，这个技能才从“给建议”变成“可落地执行”。

记录结论，让下一轮更准确

第一轮排查后，用 scripts/perf_report.py 生成报告，并把报告重新喂给下一轮使用。这能帮助 performance-engineer skill 基于真实 findings、ownership 和 validation notes 来细化建议，而不是每次都从零开始。

用证据片段增强提示词

不要只说“DB seems slow”，尽量贴上一小段紧凑的证据，例如：

query duration sample
profiler top functions
trace span summary
endpoint timings by percentile

哪怕证据不完整，也能明显提高输出质量，因为这个技能可以把建议和已观察到的热点对应起来，而不是退回默认套路。

分清“诊断”与“实施”的边界

performance-engineer for Performance Optimization 这套 workflow 最强的环节是诊断、优先级排序和验证规划。把它和第二轮专注于在你的技术栈里落地修复的工作配合起来，效果会更好。先用它判断什么最重要，再借助编码帮助安全地实施修改。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

vercel-react-best-practices

作者 vercel-labs

vercel-react-best-practices 是由 Vercel Engineering 提供的 skill，用优先级规则引导 AI 优化 React 和 Next.js 性能，涵盖瀑布流请求、bundle 体积和渲染等关键问题。

前端开发

收藏 0GitHub 24k

performance-optimization

作者 addyosmani

performance-optimization 技能帮助你先测量、找出真正瓶颈、完成优化，并验证结果。适用于已有性能要求、怀疑出现性能回退，或需要改善 Core Web Vitals、加载时间与交互延迟的场景。

性能优化

收藏 0GitHub 18.7k

supabase-postgres-best-practices

作者 supabase

supabase-postgres-best-practices 是一项面向 Supabase Postgres 优化的技能，覆盖查询调优、索引、Schema 设计、RLS 性能、锁竞争与连接管理等核心主题。

数据库工程

收藏 0GitHub 1.7k

wp-performance

作者 WordPress

使用 wp-performance 从后端排查并提升 WordPress 性能，无需浏览器界面。它支持先测量、后诊断的方式，适用于前台请求缓慢、后台页面、REST 路由和 WP-Cron 等场景，并提供关于 WP-CLI profile/doctor、通过 REST 头查看 Query Monitor、Server-Timing、数据库查询、autoloaded options、对象缓存、cron 和远程 HTTP 调用的指导。

性能优化

收藏 0GitHub 1.4k

web-perf

作者 cloudflare

web-perf 使用 Chrome DevTools MCP 分析 Web 性能。它可衡量 Core Web Vitals、基于 trace 的加载问题、阻塞渲染的资源、布局偏移、缓存问题以及可访问性缺口。适合用于性能优化、慢页面排障，以及依赖最新文档和实时 trace 的基于证据的 web-perf 指南式工作流。

性能优化

收藏 0GitHub 1.3k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份实用的 React Native 性能优化指南，聚焦启动慢、掉帧、重渲染过重、内存泄漏、bundle 体积膨胀和动画卡顿等问题。适用于需要有证据支撑的修复方案，例如 Hermes、bridge 开销、FlashList、原生模块，或排查线上版本回归性能时使用。

性能优化

收藏 0GitHub 1.3k

swift-nio

作者 Joannis

swift-nio 是一项面向 SwiftNIO 后端开发的技能，涵盖 servers、clients、pipelines、buffers、codecs，以及 EventLoop 安全的异步代码。适用于 swift-nio 使用问题、协议解析、TCP/UDP 服务、NIOAsyncChannel 集成，以及排查 EventLoop 上的阻塞工作。它是一本面向正确架构与实现的实用 swift-nio 指南。

后端开发

收藏 0GitHub 0

audit-website

作者 squirrelscan

audit-website 技能通过 squirrel CLI，基于 230+ 条规则对网站和 Web 应用进行审计，覆盖 SEO、技术、内容、性能、安全、链接和站点健康等维度，并输出可直接供 LLM 使用的可执行报告。

UX 审计

收藏 0GitHub 68

autoresearch

作者 github

autoresearch 是一套面向编码任务的自主实验循环，适用于结果可衡量的场景。它帮助开发者先明确目标、基线、指标和范围，再借助由 git 检查点支撑的流程，在代码修改、测试以及保留或回退决策之间持续迭代。

工作流自动化

收藏 0GitHub 0

godot-gdscript-patterns

作者 wshobson

godot-gdscript-patterns 可帮助 Godot 4 用户生成和审查 GDScript，改进场景结构、signals、状态机、autoloads 和 async loading 模式。适合在玩法系统、UI 流程和可维护的项目代码中引入经过验证的 Godot 架构实践，便于安装后直接用于实际开发决策。

前端开发

收藏 0GitHub 32.5k

pytorch-patterns

作者 affaan-m

pytorch-patterns 帮助你使用与设备无关的模式、可复现实验和显式张量处理来编写、审查和调试 PyTorch 代码。将 pytorch-patterns 技能用于更干净的训练循环、模型重构以及实用的 PyTorch 指南。

代码编辑

收藏 0GitHub 156.2k

nextjs-turbopack

作者 affaan-m

nextjs-turbopack 技能可帮助你在 Next.js 16+ 中使用 Turbopack，以获得更快的本地开发、HMR 以及打包器决策参考。它适合作为一份实用的 nextjs-turbopack 指南，用于安装、使用，以及在 Frontend Development 工作流中判断何时切回 webpack。

前端开发

收藏 0GitHub 156.2k

jpa-patterns

作者 affaan-m

jpa-patterns 是一份面向 Spring Boot 后端开发的实用 JPA/Hibernate 指南，涵盖实体设计、关系映射、查询调优、事务、审计、分页和连接池，帮助减少 ORM 误用并提升持久化性能。

后端开发

收藏 0GitHub 156.2k

rust-async-patterns

作者 wshobson

rust-async-patterns 是一项面向 Tokio 异步 Rust 的实用技能，涵盖任务、通道、流、超时、取消、tracing 和错误处理，适合后端开发场景。

后端开发

收藏 0GitHub 32.6k

go-concurrency-patterns

作者 wshobson

go-concurrency-patterns 帮助你以符合 Go 习惯的方式运用并发模式，涵盖 worker pools、pipelines、channels、sync primitives 以及基于 context 的取消控制。你可以根据 SKILL.md 中的指导，用它来设计更稳健的后端服务、排查竞态条件，并改进优雅关闭行为。

后端开发

收藏 0GitHub 32.6k

async-python-patterns

作者 wshobson

async-python-patterns 是一份实用指南，帮助你为 I/O 密集型 Python 系统选择更安全的 asyncio 模式。可用于了解安装与使用背景、审查用法、避免阻塞事件循环，并在设计异步 API、worker、爬虫和后端服务时，更好地权衡有界并发、取消机制，以及同步与异步之间的取舍。

后端开发

收藏 0GitHub 32.6k