可靠性

浏览 安全 下与 可靠性 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

8 个技能
W
error-handling-patterns

作者 wshobson

error-handling-patterns 可帮助团队在 exceptions 与 Result types 之间做出选择,对失败进行分类,传递上下文,并设计优雅降级方案,从而打造更可靠的 API 和服务。

可靠性
收藏 1GitHub 32.6k
W
python-resilience

作者 wshobson

python-resilience 是一项用于提升 Python 故障处理安全性的指导型技能,覆盖重试、指数退避、jitter、超时和有边界的重试窗口。适合用来安装实用的韧性模式,以保护外部调用,并通过 tenacity 风格的包装器应用更清晰的重试规则。

可靠性
收藏 0GitHub 32.6k
W
slo-implementation

作者 wshobson

使用 slo-implementation 来定义面向 Reliability 工作的 SLI、SLO、错误预算和 burn-rate 告警。它可帮助团队把服务目标转化为可衡量的指标,并结合类似 PromQL 的示例与来自 SKILL.md 的实用指导推进落地。

可靠性
收藏 0GitHub 32.6k
W
istio-traffic-management

作者 wshobson

istio-traffic-management 可帮助团队起草 Istio 流量策略,如 VirtualService、DestinationRule、Gateway 和 ServiceEntry,用于金丝雀发布、重试、熔断和流量镜像。适合将部署意图转化为清晰的路由与弹性配置清单,并提供实用提示与审查检查点。

部署
收藏 0GitHub 32.6k
W
linkerd-patterns

作者 wshobson

linkerd-patterns 帮助团队将 Linkerd 模式应用到 Kubernetes 工作负载,涵盖 mTLS、sidecar 注入、流量拆分、重试、超时、service profiles,以及基于 Deployment 的多集群发布规划。

部署
收藏 0GitHub 32.6k
W
on-call-handoff-patterns

作者 wshobson

了解 on-call-handoff-patterns 技能,帮助值班交接更可靠。可用于规范事故交接,记录当前问题、近期变更、升级状态和后续行动,适合 Reliability 团队使用。

可靠性
收藏 0GitHub 32.5k
W
incident-runbook-templates

作者 wshobson

incident-runbook-templates 可帮助团队创建结构化的事故响应 runbook,为故障处理和运维 Playbook 提供清晰的分诊、缓解、升级、沟通与恢复步骤。

操作手册
收藏 0GitHub 32.5k
S
upgrade-stripe

作者 stripe

upgrade-stripe 用于在真实代码库中升级 Stripe API 版本、服务端 SDK、Stripe.js 和移动端 SDK,提供面向后端开发的实用步骤。

后端开发
收藏 0GitHub 1.5k
可靠性 Agent Skill