作者 wshobson
error-handling-patterns 可帮助团队在 exceptions 与 Result types 之间做出选择,对失败进行分类,传递上下文,并设计优雅降级方案,从而打造更可靠的 API 和服务。
作者 wshobson
error-handling-patterns 可帮助团队在 exceptions 与 Result types 之间做出选择,对失败进行分类,传递上下文,并设计优雅降级方案,从而打造更可靠的 API 和服务。
作者 wshobson
python-resilience 是一项用于提升 Python 故障处理安全性的指导型技能,覆盖重试、指数退避、jitter、超时和有边界的重试窗口。适合用来安装实用的韧性模式,以保护外部调用,并通过 tenacity 风格的包装器应用更清晰的重试规则。
作者 wshobson
使用 slo-implementation 来定义面向 Reliability 工作的 SLI、SLO、错误预算和 burn-rate 告警。它可帮助团队把服务目标转化为可衡量的指标,并结合类似 PromQL 的示例与来自 SKILL.md 的实用指导推进落地。
作者 wshobson
istio-traffic-management 可帮助团队起草 Istio 流量策略,如 VirtualService、DestinationRule、Gateway 和 ServiceEntry,用于金丝雀发布、重试、熔断和流量镜像。适合将部署意图转化为清晰的路由与弹性配置清单,并提供实用提示与审查检查点。
作者 wshobson
linkerd-patterns 帮助团队将 Linkerd 模式应用到 Kubernetes 工作负载,涵盖 mTLS、sidecar 注入、流量拆分、重试、超时、service profiles,以及基于 Deployment 的多集群发布规划。
作者 wshobson
了解 on-call-handoff-patterns 技能,帮助值班交接更可靠。可用于规范事故交接,记录当前问题、近期变更、升级状态和后续行动,适合 Reliability 团队使用。
作者 wshobson
incident-runbook-templates 可帮助团队创建结构化的事故响应 runbook,为故障处理和运维 Playbook 提供清晰的分诊、缓解、升级、沟通与恢复步骤。
作者 stripe
upgrade-stripe 用于在真实代码库中升级 Stripe API 版本、服务端 SDK、Stripe.js 和移动端 SDK,提供面向后端开发的实用步骤。