incident-runbook-templates
par wshobsonincident-runbook-templates aide les équipes à créer des runbooks de réponse aux incidents structurés avec des procédures claires, des chemins d'escalade et des actions de récupération. Idéal pour élaborer des runbooks d'interruption, intégrer les intervenants et standardiser la gestion des incidents.
Vue d'ensemble
Qu'est-ce que incident-runbook-templates ?
incident-runbook-templates est une compétence GitHub conçue pour aider les équipes d'ingénierie et d'exploitation à créer des runbooks de réponse aux incidents structurés et exploitables. Ces modèles guident les intervenants à travers les étapes de détection, triage, atténuation, résolution et communication lors d'interruptions de service ou d'incidents opérationnels. Cette compétence est idéale pour les équipes gérant des systèmes critiques, intégrant de nouveaux ingénieurs de garde ou standardisant les procédures d'escalade sur plusieurs projets.
Qui devrait utiliser cette compétence ?
- Ingénieurs fiabilité site (SRE)
- Équipes DevOps
- Managers techniques
- Intervenants de garde
- Toute personne responsable de la gestion opérationnelle des incidents
Quels problèmes résout-elle ?
incident-runbook-templates répond au besoin d'un guide clair et étape par étape lors d'incidents sous pression. Elle aide les équipes à :
- Documenter les actions de récupération et les chemins d'escalade
- Construire des runbooks spécifiques aux services pour les interruptions, problèmes de base de données, etc.
- Standardiser les procédures de réponse entre équipes
- Réduire les difficultés d'intégration des nouveaux intervenants
Comment l'utiliser
Étapes d'installation
- Ajoutez la compétence à votre agent ou projet avec :
npx skills add https://github.com/wshobson/agents --skill incident-runbook-templates - Consultez les fichiers principaux :
SKILL.md(documentation principale de la compétence)README.md,AGENTS.md,metadata.json(si présents)- Explorez les dossiers
rules/,resources/,references/ouscripts/pour les supports complémentaires
Adapter les modèles
- Commencez par lire
SKILL.mdpour comprendre les niveaux de gravité et la structure du runbook - Personnalisez les modèles selon les outils, la matrice d'escalade et les contraintes opérationnelles de votre équipe
- Utilisez le tableau des niveaux de gravité pour définir les temps de réponse et catégories d'impact adaptés à votre environnement
Quand cette compétence est-elle adaptée ?
- Vous devez créer ou améliorer la documentation de réponse aux incidents
- Votre équipe ne dispose pas de runbooks standardisés pour les interruptions courantes
- Vous souhaitez intégrer de nouveaux ingénieurs avec des guides clairs et exploitables
Quand n'est-elle pas adaptée ?
- Vous disposez déjà de runbooks complets et à jour
- Votre réponse aux incidents est entièrement automatisée et ne nécessite pas de procédures manuelles
FAQ
Où puis-je trouver les modèles principaux de runbook ?
Ouvrez l'onglet Fichiers et consultez SKILL.md pour les modèles de base et les indications sur les niveaux de gravité.
Puis-je utiliser incident-runbook-templates pour tout type d'incident ?
Oui, les modèles sont conçus pour être adaptés à divers types d'incidents, y compris les interruptions de service, les pannes de base de données et les problèmes d'infrastructure.
Comment personnaliser les chemins d'escalade et les actions de récupération ?
Modifiez les sections du modèle dans SKILL.md pour refléter la matrice d'escalade, les points de contact et les procédures de récupération de votre équipe.
Quel fichier est recommandé pour commencer ?
Commencez par SKILL.md pour une vue d'ensemble des niveaux de gravité et de la structure du runbook, puis explorez les fichiers complémentaires selon vos besoins.
