作者 wshobson
error-handling-patterns 可協助團隊判斷何時該用 exceptions 或 Result types、如何分類失敗、傳遞上下文,以及設計優雅降級,進而打造更可靠的 API 與服務。
作者 wshobson
error-handling-patterns 可協助團隊判斷何時該用 exceptions 或 Result types、如何分類失敗、傳遞上下文,以及設計優雅降級,進而打造更可靠的 API 與服務。
作者 wshobson
python-resilience 是一項協助強化 Python 失敗處理安全性的指引型技能,涵蓋重試、指數退避、jitter、timeout 與有界重試視窗。可用來導入實用的外部呼叫韌性模式,並套用 tenacity 風格的包裝方式,讓重試規則更清楚一致。
作者 wshobson
使用 slo-implementation skill 來定義可靠性工作的 SLI、SLO、錯誤預算與 burn-rate 警示。它能協助團隊把服務目標轉成可衡量的指標,並提供 PromQL 風格範例與來自 SKILL.md 的實務指引。
作者 wshobson
istio-traffic-management 協助團隊撰寫 Istio 流量策略,如 VirtualService、DestinationRule、Gateway、ServiceEntry,涵蓋金絲雀、重試、斷路器與鏡像流量。用它把部署意圖轉成清楚的路由與韌性清單,並提供實用提示與審查檢核。
作者 wshobson
linkerd-patterns 可協助團隊將 Linkerd 模式套用到 Kubernetes 工作負載,涵蓋 mTLS、sidecar injection、traffic splits、retries、timeouts、service profiles,以及以 Deployment 為基礎的 rollout 所需的 multi-cluster 規劃。
作者 wshobson
了解 on-call-handoff-patterns 技能,讓值班交接更可靠順暢。可用於整理事故交接內容,記錄目前進行中的問題、近期變更、升級處理狀態,以及 Reliability 團隊的下一步行動。
作者 wshobson
incident-runbook-templates 可協助團隊建立結構化的事件應變 runbook,針對服務中斷與營運 Playbooks,提供清楚的初步研判、緩解、升級通報、溝通與復原步驟。
作者 stripe
upgrade-stripe 指南,協助在真實程式碼庫中升級 Stripe API 版本、伺服器端 SDK、Stripe.js 與行動端 SDK,並提供 Backend Development 的實作步驟。