python-performance-optimization

作者 wshobson

python-performance-optimization 以 profiling 優先的方式，協助診斷執行緩慢或記憶體占用偏高的 Python 程式碼，涵蓋 CPU、記憶體、I/O 瓶頸、快取、向量化、async 與 benchmarking 等實務流程。

Stars32.6k

評論0

加入時間2026年3月30日

分類性能优化

安裝指令

npx skills add wshobson/agents --skill python-performance-optimization

編輯評分

此技能評分為 75/100，代表它是相當穩健的目錄收錄候選：代理可從中獲得明確的觸發情境與充實的效能優化指引，使用者也能合理判斷是否值得安裝。它最適合作為以參考資料為核心的 Python 效能 profiling 與調校手冊；不過，相較於附帶腳本或具備更明確決策規則的頂級技能，它在可直接執行的流程支架上仍稍嫌不足。

75/100

亮點

Frontmatter 說明與「When to Use This Skill」段落，讓此技能在面對 Python 程式變慢、瓶頸分析、記憶體問題與延遲優化時，有相當清楚的觸發條件。
技能主體內容充實，涵蓋具體的 profiling 與優化主題，並附有程式碼範例，對代理而言比泛用型提示提供了更可執行的指引。
進階參考內容進一步擴展到 NumPy 向量化、快取、平行化、async I/O、資料庫優化與 benchmarking 等實用模式，覆蓋面相當完整。

注意事項

SKILL.md 中沒有提供支援腳本、安裝指令或工具設定步驟，因此代理在準備 profiler 與相關套件的執行環境時，仍可能需要自行判斷或補足。
此 repository 所呈現的流程與限制條件覆蓋度僅屬中等，使用者應預期它更偏向廣泛指南，而非具備明確分支邏輯、分階段執行的嚴謹優化流程。

Python Performance Memory Management Async 後端

總覽

python-performance-optimization 技能總覽

python-performance-optimization 技能的作用

python-performance-optimization 技能可協助 agent 判斷 Python 程式為什麼執行緩慢、為何記憶體占用過高，並根據 profiling 證據提出有針對性的修正方案，而不是靠猜測亂改。它是為了實務上的效能優化工作而設計：找出瓶頸、區分 CPU／記憶體／I/O 問題，並挑出真正符合實際負載路徑的改善方式。

哪些人適合安裝

這個技能最適合開發者、資料工程師、後端團隊，以及需要超越泛泛「把它變快」建議的 agent 工作流程。特別是在你手上已經有一個功能正確、可正常運作的 script、service、notebook 或 pipeline，只是需要改善延遲、吞吐量或記憶體表現時，它會很有幫助。

實際要解決的工作需求

大多數使用者不是只需要一段 Big O 教學，而是需要一套可重複使用的方法，來回答這些問題：

到底慢在哪裡
該怎麼正確量測
應該先做哪個優化最值得
如何避免去改那些根本不是瓶頸的程式碼

這正是 python-performance-optimization 技能比一般 prompt 更強的地方。它會把流程導向先做 profiling，再做 optimization。

這個技能和一般做法有何不同

這個 repository 不把效能當成單一問題處理，而是涵蓋多種 profiling 模式與多層次優化方式，包括：

CPU profiling
memory profiling
line-level analysis
call-graph 思維
像 caching 這類實作模式
NumPy vectorization、async I/O、parallelization 等進階路線

它在實務上的差異點，是「涵蓋面廣」加上「先 profiling、後優化」的思維方式。

最適合與不適合的使用情境

適合的情境：

緩慢的 Python endpoint、job、CLI tool、ETL 或資料處理流程
記憶體持續成長或無法解釋的 RAM 暴增
需要在 caching、演算法調整、vectorization 或 concurrency 之間做選擇
在動 production code 之前，先制定優化方案

不適合的情境：

真正瓶頸其實在 infrastructure、network topology 或 database schema，而且手上沒有任何量測資料的 codebase
團隊期待安裝後就直接拿到全自動 benchmarking script
你只是想做程式風格整理，而不是效能診斷

如何使用 python-performance-optimization 技能

python-performance-optimization 安裝方式與使用時機

請從 wshobson/agents repository 安裝這個技能：

npx skills add https://github.com/wshobson/agents --skill python-performance-optimization

安裝完成後，當你的 prompt 明確涉及 Python 效能診斷、profiling、記憶體使用、降低延遲、提升吞吐量或瓶頸分析時，就適合使用它。

先讀這些 repository 檔案

若想最快掌握重點，建議先看：

plugins/python-development/skills/python-performance-optimization/SKILL.md
plugins/python-development/skills/python-performance-optimization/references/advanced-patterns.md

SKILL.md 提供主要工作流程與工具分類。若第一輪診斷已經指向 vectorization、caching、記憶體調校、async I/O 或資料庫負載偏重的問題，再接著讀 references/advanced-patterns.md 會最有價值。

要讓技能發揮效果，輸入需要包含哪些資訊

python-performance-optimization usage 的品質，很大程度取決於你提供的證據。請盡量給 agent：

緩慢的 function、file、endpoint 或 job
預期工作負載規模
實際症狀：latency、CPU 飽和、記憶體成長、timeout、高 query count
profiling 輸出（若有）
限制條件：不能新增 dependencies、必須保留 API、只能採用 production-safe 的改法等
環境資訊：Python 版本、framework、OS、single process 或 multi-process

若缺少這些輸入，這個技能仍能建議 profiling 步驟，但建議會比較不夠具體。

把模糊需求改寫成強 prompt

較弱的 prompt：

「Optimize this Python code.」

較好的 prompt：

「Use the python-performance-optimization skill to analyze this Django view. P95 latency is 1.8s under ~200 requests/min. CPU is high, memory is stable. Here is the view code and a cProfile summary. Identify the top bottlenecks, explain whether the issue is Python execution, DB access, or serialization, and propose fixes ranked by expected impact and implementation risk.」

這樣效果更好，因為它同時提供了工作負載、症狀類型、證據與輸出格式。

先要求診斷，再要求改寫

一個好的工作流程通常是：

描述效能症狀
提供程式碼與量測資料
請 agent 判定瓶頸類型
再要求提出程式碼修改

這能避免太早進入改寫階段。當 python-performance-optimization skill 能從 metrics 推導到對應的介入方式時，價值會高得多。

哪些 profiling 輸入會明顯提升輸出品質

最有幫助的輸入包括：

CPU-heavy 程式碼的 cProfile 摘要
hot functions 的 line-profiler 結果
RAM 問題的 memory-profiler 或 object growth 證據
I/O、DB、HTTP、serialization 邊界的 timing breakdown
具代表性的 sample data，而不是 toy inputs

如果你目前還沒有量測資料，請先要求 agent 設計 profiling 計畫，而不是盲目直接做優化。

這個技能支援的典型工作流程

一份實用的 python-performance-optimization guide 通常會長這樣：

先定義效能目標
選擇正確的 profiling 類型
對具代表性的工作負載進行 profiling
找出最熱路徑或最大配置來源
選出風險最低、影響最大的優化方案
比較優化前後 benchmark
留意 correctness 與 readability 是否回退

這個流程順序，就是此技能的核心價值。

什麼時候該看進階參考文件

當瓶頸很可能落在以下類型時，再打開 references/advanced-patterns.md：

可能可從 NumPy 受益的數值迴圈
可能適合用 functools.lru_cache 的重複 pure-function 計算
可能受益於 async pattern 的高 I/O 工作負載
成本高但可平行化、適合考慮 multiprocessing 的工作
query 密集、需要用資料庫優化角度思考的應用

除非你已經知道問題類別，否則不要一開始就直接跳到這份文件。先從已量測到的瓶頸出發。

常見情境下的好 prompt 寫法

針對 CPU-bound 程式碼：

「Use the python-performance-optimization skill to review this function and cProfile output. Focus on algorithmic complexity, repeated work, and Python-level loop overhead.」

針對記憶體問題：

「Use the python-performance-optimization skill to inspect this batch job. RSS climbs from 400MB to 3GB. Suggest likely retention causes, profiling steps, and memory-safe refactors.」

針對 I/O-heavy 服務：

「Use the python-performance-optimization skill on this async API client. Requests are slow despite low CPU. Determine whether the bottleneck is blocking I/O, connection handling, serialization, or concurrency limits.」

可以期待哪些結果

這個技能最擅長的是：

選對 profiling 方法
解讀常見效能模式
依優先順序提出合理的優化方案
說明 caching、vectorization、parallelization 與簡化程式碼之間的取捨

如果你沒有提供程式碼、工作負載型態與量測資料，輸出效果就會明顯變弱。

python-performance-optimization 技能 FAQ

在 Performance Optimization 場景下，python-performance-optimization 比一般 prompt 更好嗎？

通常是的，尤其當你需要的是結構化診斷，而不是零散建議時。一般 prompt 常常會直接跳到「用 caching」或「用 NumPy」。python-performance-optimization 技能則更可能先區分 CPU、記憶體、I/O 與演算法層面的問題。

這個技能對初學者友善嗎？

是的，只要你能提供程式碼與症狀就可以開始。你不需要一開始就是 profiling 專家。不過對初學者來說，如果能提供具體證據，並要求 agent 先解釋「為什麼這個瓶頸重要」，再提出修正方案，結果通常會好很多。

使用前一定要先有 profiling 輸出嗎？

不一定，但有 profiling 輸出會讓 python-performance-optimization usage 品質提升很多。如果你目前還沒有量測資料，可以請 agent 明確告訴你該 profile 哪些項目，以及該用哪一類工具。

什麼情況下不該用這個技能？

如果問題明顯不在 Python application logic，就應該跳過它，例如：

infrastructure 資源明顯不足
網路問題
資料庫伺服器設定錯誤，且沒有任何 app-level 證據
與 Python backend 執行無關的 frontend latency

在這些情況下，這個技能仍可協助你整理調查方向，但不應作為主要工具。

它只處理速度問題，還是也包含記憶體？

兩者都包含。這個 repository 明確涵蓋 memory profiling 與 memory optimization，以及 CPU profiling 與執行時間分析，所以比只會談「速度」的 prompt 更實用。

它能幫上資料工作負載嗎？

可以，尤其當改善方向可能涉及 vectorization、batching、caching，或減少 Python loop overhead 時更有幫助。對數值運算與資料處理程式碼來說，進階參考文件特別值得看。

如何提升 python-performance-optimization 技能的使用效果

提供 benchmark 證據，不要只貼原始碼

想讓 python-performance-optimization 輸出更好，最有效的方式就是提供：

前後對照 timings
profiling 摘要
sample input size
throughput 或 latency 目標

只有原始碼時，agent 只能提出假設；有量測資料時，它才能排出優先順序。

明確說出你懷疑的瓶頸類型

即使你不完全確定，也請說出你目前的判斷：

CPU-bound
memory-bound
database-bound
network/I/O-bound
startup-time 問題
batch throughput 問題

這能幫助技能選對診斷路徑，避免落入泛泛而談的建議。

納入真實限制條件

優化建議會因限制條件而有很大差異。請直接說清楚：

不能修改 public API
不能加入 NumPy
必須維持對 junior team 也容易閱讀
必須能跑在 AWS Lambda
必須保留 deterministic ordering
multi-tenant 的記憶體上限固定

這些資訊對決策品質的幫助，往往比單純要求「最佳效能」還大。

要求輸出排序過的建議

一個好的 prompt，會要求 agent 按下列面向排序建議：

預期影響
實作成本
correctness 風險
dependency 成本

這能避免常見失誤：第一個答案就先推薦複雜改動，卻忽略像是減少重複計算或修正低效 query 這種更容易先拿到成果的改善。

留意常見失敗模式

以下情況會削弱 python-performance-optimization skill 的效果：

優化了根本不在 hot path 上的程式碼
使用與 production workload 不符的 microbenchmark
過度重視花俏技巧，忽略可維護性
在其實受 I/O 或 GIL 行為限制的情況下硬套 multiprocessing
建議使用 caching，卻沒有討論 invalidation 或記憶體成本

請要求 agent 針對每個優化建議，都說明它與已量測瓶頸之間的對應關係。

收到第一輪答案後持續迭代

一個有力的第二輪 prompt 會像這樣：

「Here is the updated code and new benchmark. The runtime dropped from 2.4s to 1.5s, but memory increased by 35%. Re-run the python-performance-optimization analysis and suggest the next best change with minimal memory growth.」

這能把技能用成一個持續優化迴圈，而不是一次性的改寫工具。

有策略地指定 repository 閱讀路徑

如果第一輪回答仍然太泛，請明確要求 agent 以這些檔案為推理依據：

SKILL.md：profiling 類別與工作流程
references/advanced-patterns.md：vectorization、caching、memory management、parallelization、async I/O、benchmarking 等實作選項

這通常能明顯提高輸出的具體程度。

如果卡在不知從何開始，就先要求量測計畫

如果你的阻礙是「不知道該怎麼開始」，可以先要求一份最小可行計

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

vercel-react-best-practices

作者 vercel-labs

vercel-react-best-practices 是 Vercel Engineering 推出的 skill，用優先級規則引導 AI agent 優化 React 與 Next.js 效能，聚焦 waterfall、bundle size 與 rendering。

前端开发

收藏 0GitHub 24k

performance-optimization

作者 addyosmani

performance-optimization 技能可協助你先量測、找出真正瓶頸、修正問題，並驗證成效。當有效能需求、懷疑出現回歸，或需要改善 Core Web Vitals、載入時間或互動延遲時，這項技能特別適合使用。

性能优化

收藏 0GitHub 18.7k

supabase-postgres-best-practices

作者 supabase

supabase-postgres-best-practices 是一個用於 Supabase Postgres 最佳化的技能，涵蓋查詢調校、索引、綱要設計、RLS 效能、鎖定與連線管理。

資料庫工程

收藏 0GitHub 1.7k

wp-performance

作者 WordPress

使用 wp-performance 從後端調查並改善 WordPress 效能，不需要瀏覽器介面。它支援先量測、後診斷的流程，適用於緩慢的前台請求、管理後台頁面、REST 路由與 WP-Cron，並提供 WP-CLI profile/doctor、透過 REST header 使用 Query Monitor、Server-Timing、資料庫查詢、autoloaded options、物件快取、cron 與遠端 HTTP 呼叫等指引。

性能优化

收藏 0GitHub 1.4k

web-perf

作者 cloudflare

web-perf 透過 Chrome DevTools MCP 分析網站效能。它會衡量 Core Web Vitals、以 trace 為基礎的載入問題、阻擋渲染的資源、版面位移、快取問題與可及性缺口。若你需要 Performance Optimization、除錯緩慢頁面，或依據最新文件與即時 traces 進行的 web-perf 指南式工作流程，都適合使用 web-perf skill。

性能优化

收藏 0GitHub 1.3k

react-native-best-practices

作者 callstackincubator

react-native-best-practices 是一份實用的 React Native 效能優化指南，涵蓋啟動緩慢、掉幀、重繪過重、記憶體洩漏、bundle 膨脹與動畫卡頓等問題。當你需要針對 Hermes、bridge overhead、FlashList、原生模組，或排查 release regression 時，它能提供有依據的修正方向。

性能优化

收藏 0GitHub 1.3k

swift-nio

作者 Joannis

swift-nio 是一個用於 SwiftNIO 後端開發的技能，涵蓋 server、client、pipeline、buffer、codec，以及 event-loop 安全的 async 程式碼。可用來處理 swift-nio 使用問題、protocol parsing、TCP/UDP 服務、NIOAsyncChannel 整合，以及排查 EventLoop 上的 blocking work。這是一份實用的 swift-nio 指南，著重正確的架構與實作方式。

後端开发

收藏 0GitHub 0

audit-website

作者 squirrelscan

audit-website skill 透過 squirrel CLI，依據 230+ 項規則稽核網站與 Web App，涵蓋 SEO、技術、內容、效能、安全性、連結與網站健康度，並回傳可直接供 LLM 使用、具體可執行的報告。

UX 稽核

收藏 0GitHub 68

autoresearch

作者 github

autoresearch 是一套用於程式開發任務的自主實驗迴圈，特別適合有可量化成果的情境。它會協助開發者先定義目標、基準、衡量指標與範圍，再透過以 git 檢查點為基礎的流程，反覆進行程式碼修改、測試，以及保留或還原變更的判斷。

工作流自動化

收藏 0GitHub 0

godot-gdscript-patterns

作者 wshobson

godot-gdscript-patterns 可協助 Godot 4 使用者產生與檢視更完善的 GDScript，涵蓋場景結構、signals、state machines、autoloads 與 async loading 等常見模式。適合用來把經驗驗證過的 Godot 架構導入遊戲系統、UI 流程與較易維護的專案程式碼。

前端开发

收藏 0GitHub 32.5k

pytorch-patterns

作者 affaan-m

pytorch-patterns 可協助你以裝置無關的模式、可重現的實驗，以及明確的 tensor 處理來撰寫、審閱與除錯 PyTorch 程式碼。這個 pytorch-patterns 技能適合用來打造更乾淨的訓練迴圈、重構模型，以及取得實用的 PyTorch 指引。

程式碼编辑

收藏 0GitHub 156.2k

nextjs-turbopack

作者 affaan-m

nextjs-turbopack 技能可協助你在 Next.js 16+ 中使用 Turbopack，以提升本機開發速度、HMR 與打包器決策效率。它可作為實用的 nextjs-turbopack 指南，涵蓋安裝、使用，以及在 Frontend Development 工作流程中何時切回 webpack。

前端开发

收藏 0GitHub 156.2k

jpa-patterns

作者 affaan-m

jpa-patterns 是一份實用的 JPA/Hibernate 指南，適用於 Spring Boot 後端開發。內容涵蓋 entity 設計、關聯關係、查詢調校、交易、稽核、分頁與 pooling，協助減少 ORM 常見錯誤並提升 persistence 效能。

後端开发

收藏 0GitHub 156.2k

rust-async-patterns

作者 wshobson

rust-async-patterns 是一項實用的 Tokio 非同步 Rust 技能，涵蓋 tasks、channels、streams、timeouts、cancellation、tracing 與 error handling，適合後端開發使用。

後端开发

收藏 0GitHub 32.6k

go-concurrency-patterns

作者 wshobson

go-concurrency-patterns 協助你以符合 Go 慣用法的方式運用並行模式，涵蓋 worker pools、pipelines、channels、sync primitives，以及以 context 為基礎的 cancellation。你可以依據 SKILL.md 的指引，用它來設計更安全的後端服務、排查 race conditions，並改善 graceful shutdown 的行為。

後端开发

收藏 0GitHub 32.6k

async-python-patterns

作者 wshobson

async-python-patterns 是一份實用指南，協助你為以 I/O 為主的 Python 系統選擇安全的 asyncio 模式。可用來掌握安裝與採用情境、檢視使用方式、避免阻塞 event loop，並在設計 async API、workers、scrapers 與後端服務時，妥善處理有限並發、取消機制，以及 sync 與 async 之間的取捨。

後端开发

收藏 0GitHub 32.6k