par wshobson
error-handling-patterns aide les équipes à choisir entre exceptions et types Result, à classer les échecs, à propager le contexte et à concevoir une dégradation progressive pour des API et services plus fiables.
par wshobson
error-handling-patterns aide les équipes à choisir entre exceptions et types Result, à classer les échecs, à propager le contexte et à concevoir une dégradation progressive pour des API et services plus fiables.
par wshobson
python-resilience est une skill de référence pour rendre la gestion des erreurs Python plus sûre grâce aux retries, au backoff exponentiel, au jitter, aux timeouts et à des fenêtres de reprise bornées. Utilisez-la pour mettre en place des patterns de résilience concrets pour les appels externes et appliquer des wrappers de type tenacity avec des règles de retry plus claires.
par wshobson
Utilisez le skill slo-implementation pour définir des SLI, des SLO, des budgets d’erreur et des alertes de burn rate pour les travaux de fiabilité. Il aide les équipes à transformer des objectifs de service en cibles mesurables grâce à des exemples de style PromQL et à des conseils pratiques issus de SKILL.md.
par wshobson
istio-traffic-management aide les équipes à rédiger des politiques de trafic Istio comme VirtualService, DestinationRule, Gateway et ServiceEntry pour le canary, les retries, le circuit breaking et le mirroring. Utilisez-le pour transformer l’intention de déploiement en manifests de routage et de résilience clairs, avec des prompts pratiques et des points de contrôle pour la relecture.
par wshobson
linkerd-patterns aide les équipes à appliquer des modèles Linkerd aux charges de travail Kubernetes, notamment pour le mTLS, l’injection de sidecar, les traffic splits, les retries, les timeouts, les service profiles et la planification multi-cluster pour des rollouts basés sur Deployment.
par wshobson
Découvrez la compétence on-call-handoff-patterns pour fiabiliser les relais entre astreintes. Utilisez-la pour structurer les passations d’incident, consigner les problèmes en cours, les changements récents, l’état des escalades et les prochaines actions des équipes Reliability.
par wshobson
incident-runbook-templates aide les équipes à créer des runbooks structurés de réponse aux incidents, avec des étapes claires de triage, d’atténuation, d’escalade, de communication et de rétablissement pour les pannes et les playbooks opérationnels.
par stripe
Guide upgrade-stripe pour mettre à niveau les versions de l’API Stripe, les SDK côté serveur, Stripe.js et les SDK mobiles dans des bases de code réelles, avec des étapes pratiques pour le développement backend.