temporal-python-testing

作者 wshobson

temporal-python-testing 可協助團隊以 pytest 測試 Temporal Python workflows，涵蓋 time-skipping、mocked-activity 整合測試、replay testing 與本機設定指引，讓 workflow 變更與 CI 更穩定可靠。

Stars32.6k

評論0

加入時間2026年3月30日

分類测试自動化

安裝指令

npx skills add wshobson/agents --skill temporal-python-testing

編輯評分

這個 skill 評分為 78/100，代表它很適合作為處理 Temporal Python 測試代理的目錄收錄項目。該 repo 提供明確的使用時機、實用的測試分類，以及以範例為主的完整指引，涵蓋單元測試、整合測試、replay 測試與本機設定情境；不過，使用者仍需自行補上一些專案特定的串接與安裝細節。

78/100

亮點

觸發情境明確：SKILL.md 清楚說明，適合用於 Temporal Python 的單元測試、整合測試、replay、本機開發與測試失敗除錯流程。
實務深度不錯：資源檔案提供具體的 pytest、WorkflowEnvironment、Worker、mocking、replay 與 Docker Compose 範例，而不只是停留在高層次建議。
資訊分層清楚：主 skill 會引導使用者前往更聚焦的資源，分別處理單元測試、整合測試、replay 測試與本機設定。

注意事項

SKILL.md 未提供安裝指令或明確的設定檢查清單，因此實際導入時，仍需自行推敲相依套件與環境準備方式。
現有內容較偏重範例，對於決策規則或限制條件著墨較少，遇到邊界情境時，代理可能需要自行判斷何時該採用哪一種測試策略。

Python 测试後端工作流 Docker Postgres Ci Cd

總覽

temporal-python-testing 技能總覽

temporal-python-testing 技能是做什麼的

temporal-python-testing 技能的重點，不是單純幫你寫一些泛用的 pytest 範例，而是協助你為 Temporal Python workflows 設計並執行可靠的測試。它特別適合正在打造 workflow 為核心系統的團隊：需要快速回饋、能安全重構，並確保 workflow 程式碼持續維持 determinism。

哪些人適合安裝 temporal-python-testing

這個技能特別適合：

已經在使用 Temporal 的 Python 開發者
正在為 workflow 程式碼補齊測試覆蓋的團隊
正在排查不穩定 Temporal 測試的工程師
要為 workflow 變更做部署前審查的 reviewer
需要的是 temporal-python-testing for Test Automation，而不是臨時問答式提示的人

如果你還在評估要不要採用某個 workflow engine，或你的專案根本沒有使用 Temporal Python SDK，這個技能的幫助就會比較有限。

真正要解決的工作是什麼

多數使用者要的其實不只是「一個測試」，而是想快速回答幾個很實際的問題：

我要怎麼測 workflow 邏輯，又不用真的等時間流逝？
什麼時候該 mock activities，什麼時候該跑比較完整的 worker 測試？
在部署 workflow 變更前，要怎麼檢查 determinism？
我需要哪些本機環境設定，才能讓開發與 CI 的測試結果一致？

temporal-python-testing skill 的價值，在於它把這些決策整理成明確的測試類型：用 time-skipping 做單元測試、用 mocked activities 做整合測試、用 replay testing 驗證相容性，以及提供本機環境建置指引。

它和一般 Temporal 提示有什麼不同

一般提示可以產出範例程式碼，但這個技能提供的是更清楚的測試策略：

它以 Temporal 特有的測試邊界為核心
它把 integration tests 作為預設主力
它涵蓋 replay testing，而這正是很多泛用回答常忽略的部分
它會把你導向具體的資源檔，而不是塞給你一份龐大又混雜的單一文件

因此，不論你是在做安裝評估，或團隊想要統一 workflow 測試方法，它都更實用。

決定是否安裝前，先看哪些檔案

如果你正在評估 temporal-python-testing，建議先依序查看這些檔案：

SKILL.md
resources/unit-testing.md
resources/integration-testing.md
resources/replay-testing.md
resources/local-setup.md

這個閱讀順序也對應大多數團隊的採用路徑：先搞定快速的本機測試，再進到 orchestration 測試，最後補上部署安全性。

如何使用 temporal-python-testing 技能

如何安裝 temporal-python-testing

從 wshobson/agents repository 安裝：

npx skills add https://github.com/wshobson/agents --skill temporal-python-testing

由於這個 repository 會把它存放在 plugins/backend-development/skills/temporal-python-testing，安裝後請確認你的工具能存取該 repo path。

第一次使用 temporal-python-testing 的最佳起手流程

第一次使用時，不需要一口氣把所有內容看完。建議照這個順序：

先讀 SKILL.md，了解範圍與測試思路。
如果你當前目標是快速 workflow 測試，就看 resources/unit-testing.md。
如果你需要 mocked activities 與 worker-based tests，就看 resources/integration-testing.md。
如果你要修改已經被執行中流程用到的 workflow 程式碼，先看 resources/replay-testing.md。
如果卡點是環境建置，不是測試設計，就看 resources/local-setup.md。

這樣走，可以避開一開始就被「Temporal 測試選項太多」淹沒的常見問題。

temporal-python-testing 需要你提供哪些資訊

temporal-python-testing usage 的品質，很大程度取決於你提供的細節。建議至少包含：

workflow class 名稱
activity 名稱與 side effects
這次要做的是 unit、integration，還是 replay 測試
目前技術堆疊：pytest、temporalio、Docker、本機 Temporal server
失敗型態：timeout、nondeterminism、mock setup、worker registration、flaky assertions
你希望達到的信心水準：本機開發、CI，或部署前相容性檢查

如果缺少這些資訊，輸出通常會停留在過於泛泛的層次。

把模糊需求變成高品質提示

弱提示：

「Help me test a Temporal workflow in Python.」

更好的提示：

「Use the temporal-python-testing skill to propose pytest tests for a Temporal Python workflow that waits on timers, calls two activities, and must stay deterministic across deployments. I want a fast local test, an integration test with mocked activities, and guidance on replay testing before release.”

最好的提示：

“Use the temporal-python-testing skill. I have OrderWorkflow.run(order_id) that sleeps for retries, calls charge_card and send_receipt, and currently fails in CI. Generate a test plan using pytest async fixtures, WorkflowEnvironment.start_time_skipping(), mocked activity patterns where appropriate, and a replay testing step for deployment safety. Explain what should be unit tested versus integration tested.”

更完整的版本之所以效果明顯更好，是因為它會把技能強制帶進正確的測試模式。

這個 temporal-python-testing 技能主要支援的使用模式

從 repository 的內容可以清楚看出四條實務路線：

temporal-python-testing 的單元測試用法

當你需要快速驗證 workflow 行為、timers 與 branching logic 時就用這條路。技能會引導你使用 WorkflowEnvironment.start_time_skipping()，讓長時間延遲可以瞬間完成。

temporal-python-testing 的整合測試用法

當你想驗證 worker registration 與 workflow orchestration，同時 mock 外部 activity 行為時，這是最合適的方式。這也是大多數 workflow 邏輯的預設建議做法。

temporal-python-testing 的 replay testing 用法

在要發佈可能影響既有執行中流程的 workflow 程式碼變更之前，應優先使用這條路。對正式環境安全性來說，這是價值最高的一部分。

temporal-python-testing 的本機環境建置用法

如果你真正卡住的是 Temporal server、UI 與 pytest 環境無法穩定跑起來，而不是測試設計本身，就該走這條路。

temporal-python-testing 隱含推薦的測試策略

temporal-python-testing guide 在測試策略上並不是中立的，它明確偏向：

以 integration tests 為大宗
unit tests 用於隔離的 workflow 行為與 activity 邏輯
end-to-end tests 只少量使用
用 replay tests 做 backward compatibility 與 determinism 檢查

這種取向其實很有幫助，因為它能避免團隊把太多時間投進又慢又脆弱的 end-to-end test 套件。

安裝與採用 temporal-python-testing 前的實際依賴條件

這個技能本身偏向文件與方法指引，但它預設你的專案能支援：

使用 pytest 的 Python 專案
採用 Temporal Python SDK
async 測試執行
在測試中建立 worker
視需求以 Docker 為基礎的本機 Temporal stack，供開發或 CI 使用

根據資源檔內容，本機環境通常會用 Docker Compose 搭配 Temporal、Postgres 與 Temporal UI。若你的團隊無法在本機或 CI 執行 Docker，最好一開始就先確認，因為這會直接影響你能不能完整採用這個技能的建議做法。

你可以要求 temporal-python-testing 產出的結果範例

適合的 temporal-python-testing usage 請求包括：

「Generate a pytest fixture for time-skipping workflow tests.」
「Show how to mock activities in a worker-based integration test.」
「Design replay tests for multiple stored workflow histories.」
「Recommend a split between unit, integration, and end-to-end tests for this workflow.」
「Help debug a nondeterminism failure after refactoring a workflow.」

這些都比抽象地要求「test examples」來得有效。

立即提升 temporal-python-testing 輸出品質的小技巧

直接點名你要測的 workflow entrypoint。
明確說出 activities 要 mock 還是要跑真實版本。
提到 timers、retries、signals，或長時間等待。
說明這個 workflow 是否已經有 production history。
如果 replay 或 worker 啟動失敗，附上目前錯誤輸出。

Temporal 測試問題通常卡的不是語法，而是邊界切分。你把邊界描述得越清楚，這個技能就越能幫上忙。

temporal-python-testing 最能幫你省時間的地方

它最大的價值，不是幫你產生 boilerplate，而是避免一些很常見的錯誤方向：

只寫 end-to-end tests
面對大量 timer 的 workflow 卻沒用 time-skipping
mock 過頭，或 mock 不夠
在 workflow 變更前跳過 replay testing
把本機環境問題和測試設計問題混在一起處理

如果這些正是你團隊目前的痛點，那麼 temporal-python-testing install 很值得考慮。

temporal-python-testing 技能 FAQ

temporal-python-testing 適合新手嗎？

適合，但前提是你已經懂基本的 pytest 和基本的 Temporal 概念；如果兩邊都還很陌生，就不太適合。這個技能預設你已經理解 workflows、activities、workers 與 async Python，至少要能判斷測試應該放在哪一層。

這比直接請 LLM 產 Temporal 測試程式碼更好嗎？

通常是，尤其在真實專案裡。泛用提示常常會漏掉 Temporal 特有的重點，例如 determinism、replay validation 與 time-skipping。當正確性比快速拼出範例程式碼更重要時，temporal-python-testing skill 通常更可靠。

它有特別處理 replay testing 嗎？

有。這正是使用 temporal-python-testing 最有力的理由之一。repository 裡有專門的 resources/replay-testing.md，聚焦在如何拿已記錄的 event histories 來驗證 workflow 變更。

什麼情況下不該使用 temporal-python-testing？

以下情況可以略過：

你不是用 Temporal Python
你只需要很基礎的 pytest 複習
你的問題是一般性的 mocking，不是 workflow 行為
你需要的是 production architecture 指引，而不是 testing 指引

它很專精；只有你的問題型態對上時，這種專精才會變成優勢。

temporal-python-testing 有涵蓋本機 Temporal 環境建置嗎？

有。resources/local-setup.md 包含以 Docker Compose 為基礎的建置模式，涵蓋本機 Temporal server、Postgres 與 UI。如果你的測試需要比較完整的開發環境，這部分就很重要。

temporal-python-testing 主要是給 unit tests 用的嗎？

不是。原始內容明確把 integration tests 放在主要測試路線，unit tests 與 end-to-end tests 則是更有選擇性地使用。若你的團隊只想做隔離式 unit tests，那你其實只會用到這個技能的一部分。

temporal-python-testing 能幫上 CI 嗎？

可以，特別適合這幾類情境：

workflow 測試套件自動化
以 coverage 為導向的測試策略
部署前的 replay 檢查
跨機器一致的環境建置

這個技能本身不會直接附 CI scripts，但它提供的是你可以在 CI pipeline 裡實作落地的測試模式。

如何改善 temporal-python-testing 技能的使用效果

一開始就指定你要的 temporal-python-testing 測試類型

想讓 temporal-python-testing 更快給出可用結果，最直接的方法，就是先講清楚你屬於哪一條路線：

unit test
integration test
replay test
local setup/debugging

如果你不先選，回覆很容易把多種模式混在一起，反而增加整理成本。

提供 workflow 細節，不要只給架構摘要

不好的輸入：

「We have a Temporal-based order system.」

更好的輸入：

“OrderWorkflow waits for payment confirmation, retries every hour, calls charge_card, and emits a receipt activity. We need tests for timeout handling and replay safety after refactoring retry logic.”

這會大幅影響答案品質，因為 timer 行為、activity orchestration 與相容性風險都被明確講出來了。

告訴 temporal-python-testing 現在到底是哪裡壞掉了

這個技能在以下常見失敗情境中，能提供更精準的協助：

程式碼變更後出現 workflow nondeterminism
worker 沒有註冊到預期的 activity 或 workflow
mocked activity assertions 沒有觸發
長時間 timers 讓測試變得很慢
本機 Temporal 環境無法乾淨啟動
不確定哪些應該做 unit test、哪些應該做 integration test

先說失敗點，不要只講你理想中的最終結果。

有選擇地使用 resource files

常見錯誤之一，是把整個技能當成一份大文件來看。更好的方式是：

用 resources/unit-testing.md 處理 time-skipping fixtures 與隔離行為
用 resources/integration-testing.md 處理以 mock 驅動的 orchestration tests
用 resources/replay-testing.md 處理部署安全檢查
只有在環境問題真的卡住執行時，才看 resources/local-setup.md

這樣可以減少上下文雜訊，讓產出的協助更貼近你的需求。

不只要程式碼，也要問取捨理由

一個好的 temporal-python-testing guide 提示，應該要求模型說明為什麼要放在某個測試層級：

為什麼這是 integration test，不是 unit test？
哪些 activities 應該 mock，哪些應該保留真實行為？
哪些程式碼變更一定要做 replay testing？
哪些應該放進 CI，哪些只需要本機檢查？

這些問題比單純拿到幾段程式碼，更能建立長期可維護的測試策略。

用真實限制條件來強化提示

請把這些限制條件一併說明清楚：

CI 執行時間限制
開發者筆電不能跑 Docker
是否有 production histories 可用
是否需要達成 coverage 目標
外部依賴是否容易 flaky
是否有多個 workflows 共用 activities

限制條件會迫使技能推薦你真正能落地採用的做法，而不只是理論上可行。

在第一次輸出後再迭代一次

拿到第一版結果後，可以接著用這些 follow-up：

「Convert this into pytest fixtures.」
「Reduce this to the minimum deterministic test set.」
「Show where to use mocked activities versus real ones.」
「Add replay testing for existing workflow histories.」
「Rewrite for our exact workflow names and task queues.」

第一個回答通常比較像策略草稿；第二輪之後，temporal-python-testing skill 才更接近可以直接實作的程度。

小心 temporal-python-testing 最常見的採用陷阱

最大的陷阱，就是期待單一測試風格能解決所有問題。Temporal 程式碼通常需要混合搭配：

用快速的 time-skipping tests 驗證 workflow 邏輯
用 integration tests 建立 orchestration 的信心
用 replay tests 確保演進過程安全

如果你是用這種分層思維來使用這個技能，輸出通常會更可執行，也更貼近正式環境需求。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

playwright-interactive

作者 openai

playwright-interactive 是一個瀏覽器自動化技能，適用於本機網頁與 Electron 應用中的持久化 Playwright 工作階段。可用來檢查 UI 狀態、重試互動，以及執行功能或視覺 QA，而不必重啟工具鏈。當你需要一本實用的 playwright-interactive 迭代除錯指南時，特別適合使用。

瀏覽器自動化

收藏 0GitHub 0

playwright-skill

作者 testdino-hq

playwright-skill 是一份專為 Playwright 設計的可靠瀏覽器自動化指南。它能幫助團隊撰寫、除錯與擴充測試，涵蓋 E2E 流程、API 檢查、元件測試、視覺回歸、可及性、驗證、CI/CD，以及從 Cypress 或 Selenium 遷移。當你需要的是實用模式，而不是泛用的測試建議時，就適合使用 playwright-skill。

测试自動化

收藏 0GitHub 0

laravel-tdd

作者 affaan-m

laravel-tdd 是一份適用於 Laravel 的測試驅動開發指南，涵蓋 PHPUnit 與 Pest。它可協助你判斷單元、功能與整合測試的選擇，規劃資料庫策略、使用 fakes、設定覆蓋率目標，以及建立實用的測試自動化工作流程。

测试自動化

收藏 0GitHub 156.2k

cpp-testing

作者 affaan-m

cpp-testing 技能可協助你使用 GoogleTest、GoogleMock、CMake 與 CTest 來撰寫、執行與除錯 C++ 測試。適合用於覆蓋率分析、修正不穩定測試、以 sanitizer 為基礎的診斷，以及在現代 C++ 專案中實作實用的 cpp-testing 工作流程。

测试自動化

收藏 0GitHub 156.1k

test-driven-development

作者 addyosmani

test-driven-development 技能可協助你先寫出會失敗的測試，再用最小幅度的修正讓測試通過。適合用於邏輯變更、錯誤修復、回歸問題與邊界情境，特別是在你需要可驗證證據，而不只是看似合理的修補方案時。

Skill 测试

收藏 0GitHub 18.8k

wp-playground

作者 WordPress

wp-playground skill 可協助你建立可丟棄、可重現的 WordPress Playground 環境，用於外掛與佈景主題測試、版本切換、blueprints、snapshots 以及隔離式除錯。它支援透過 @wp-playground/cli 的瀏覽器或 CLI 工作流程，特別適合後端開發、QA，以及受控的問題重現。

後端开发

收藏 0GitHub 1.4k

playwright-best-practices

作者 currents-dev

playwright-best-practices 是一套針對 Playwright + TypeScript 的技能，聚焦於撰寫穩定測試、降低 flaky、優化 auth 流程、判斷 fixtures 與 page objects 的取捨，並以實務 repo 內容提供 CI、popups、mobile、iframes、websockets 與多使用者情境的操作指引。

测试自動化

收藏 0GitHub 174

playwright-skill

作者 lackeyjb

playwright-skill 是一個瀏覽器自動化技能，適合用來測試頁面、填寫表單、檢查連結、截圖、驗證響應式版面，以及處理登入或結帳流程。它會自動偵測開發伺服器，搭配通用執行器，幫助你用更少的設定與猜測，穩定執行 Playwright 任務。

瀏覽器自動化

收藏 0GitHub 0

property-based-testing

作者 trailofbits

這份 property-based-testing 技能指南涵蓋如何在多種語言與 smart contracts 中撰寫、審查與改進 PBT。可用來辨識 roundtrip、idempotence、invariant、parser、validator 與 normalization 等情境，選擇合適的 generators，並判斷何時 property-based-testing 比 example-based tests 更有優勢。

Skill 测试

收藏 0GitHub 5k

terraform-test

作者 hashicorp

terraform-test 是一份實用指南，教你如何使用 `.tftest.hcl` 檔案、`run` 區塊、assertions、mocks，以及適合 CI 的工作流程來撰寫與執行 Terraform 測試。可用來在合併前驗證 module outputs、resource arguments、條件邏輯，以及 plan 或 apply 行為。

程式碼生成

收藏 0GitHub 583

browser-testing-with-devtools

作者 addyosmani

browser-testing-with-devtools 可透過 Chrome DevTools MCP 協助代理測試與除錯真實瀏覽器行為。可用來檢查 DOM、擷取主控台錯誤、分析網路請求、進行效能剖析，並在實際瀏覽器中驗證修正結果。

测试自動化

收藏 0GitHub 18.7k

ios-simulator-skill

作者 conorluddy

ios-simulator-skill 是一個以任務為導向的 iOS 模擬器 skill，涵蓋具備可及性意識的 App 啟動、導覽、文字輸入、手勢操作、截圖、狀態擷取、建置/測試迴圈，以及模擬器生命週期控制。它的設計目標是降低 AI 代理、QA 工程師與開發者在重複性 iOS 測試自動化工作中的猜測成本。

测试自動化

收藏 0GitHub 0

autoresearch

作者 github

autoresearch 是一套用於程式開發任務的自主實驗迴圈，特別適合有可量化成果的情境。它會協助開發者先定義目標、基準、衡量指標與範圍，再透過以 git 檢查點為基礎的流程，反覆進行程式碼修改、測試，以及保留或還原變更的判斷。

工作流自動化

收藏 0GitHub 0

atheris

作者 trailofbits

Atheris 是一個建立在 libFuzzer 上、以覆蓋率導向的 Python fuzzing skill。可用 atheris skill 來 fuzz 純 Python 程式碼與 Python C extension，找出當機、卡住與記憶體安全漏洞，並以快速、實用的 harness 指引支援 Security Audit 工作流程。

安全稽核

收藏 0GitHub 5k

playwright-cli

作者 VoltAgent

playwright-cli 是一個可從命令列操作 Playwright 的瀏覽器自動化技能。它可協助開啟頁面、檢查元素、點選流程、填寫表單、擷取截圖、模擬請求，以及從真實互動產生測試程式。適合需要可重複執行的瀏覽器自動化與 UI 測試情境。

瀏覽器自動化

收藏 0GitHub 8.5k

playwright

作者 openai

使用 playwright 技能，透過終端機搭配包裝腳本與 `playwright-cli` 操控真實瀏覽器。它適合各類瀏覽器自動化工作，例如導覽、表單填寫、截圖、快照、資料擷取與 UI 流程除錯。先確認 `npx` 是否可用，安裝技能，設定 `PWCLI`，再依照以 CLI 為先的工作流程執行。

瀏覽器自動化

收藏 0GitHub 0