Reliability

Explorez les agent skills lies a Reliability dans Securite et comparez les workflows, outils et cas d usage associes.

8 skills

error-handling-patterns

par wshobson

error-handling-patterns aide les équipes à choisir entre exceptions et types Result, à classer les échecs, à propager le contexte et à concevoir une dégradation progressive pour des API et services plus fiables.

Reliability

Favoris 1GitHub 32.6k

python-resilience

par wshobson

python-resilience est une skill de référence pour rendre la gestion des erreurs Python plus sûre grâce aux retries, au backoff exponentiel, au jitter, aux timeouts et à des fenêtres de reprise bornées. Utilisez-la pour mettre en place des patterns de résilience concrets pour les appels externes et appliquer des wrappers de type tenacity avec des règles de retry plus claires.

Reliability

Favoris 0GitHub 32.6k

slo-implementation

par wshobson

Utilisez le skill slo-implementation pour définir des SLI, des SLO, des budgets d’erreur et des alertes de burn rate pour les travaux de fiabilité. Il aide les équipes à transformer des objectifs de service en cibles mesurables grâce à des exemples de style PromQL et à des conseils pratiques issus de SKILL.md.

Reliability

Favoris 0GitHub 32.6k

istio-traffic-management

par wshobson

istio-traffic-management aide les équipes à rédiger des politiques de trafic Istio comme VirtualService, DestinationRule, Gateway et ServiceEntry pour le canary, les retries, le circuit breaking et le mirroring. Utilisez-le pour transformer l’intention de déploiement en manifests de routage et de résilience clairs, avec des prompts pratiques et des points de contrôle pour la relecture.

Deployment

Favoris 0GitHub 32.6k

linkerd-patterns

par wshobson

linkerd-patterns aide les équipes à appliquer des modèles Linkerd aux charges de travail Kubernetes, notamment pour le mTLS, l’injection de sidecar, les traffic splits, les retries, les timeouts, les service profiles et la planification multi-cluster pour des rollouts basés sur Deployment.

Deployment

Favoris 0GitHub 32.6k

on-call-handoff-patterns

par wshobson

Découvrez la compétence on-call-handoff-patterns pour fiabiliser les relais entre astreintes. Utilisez-la pour structurer les passations d’incident, consigner les problèmes en cours, les changements récents, l’état des escalades et les prochaines actions des équipes Reliability.

Reliability

Favoris 0GitHub 32.5k

incident-runbook-templates

par wshobson

incident-runbook-templates aide les équipes à créer des runbooks structurés de réponse aux incidents, avec des étapes claires de triage, d’atténuation, d’escalade, de communication et de rétablissement pour les pannes et les playbooks opérationnels.

Playbooks

Favoris 0GitHub 32.5k

upgrade-stripe

par stripe

Guide upgrade-stripe pour mettre à niveau les versions de l’API Stripe, les SDK côté serveur, Stripe.js et les SDK mobiles dans des bases de code réelles, avec des étapes pratiques pour le développement backend.

Backend Development

Favoris 0GitHub 1.5k