incident-runbook-templates
por wshobsonO incident-runbook-templates ajuda equipes a criar runbooks estruturados para resposta a incidentes, com procedimentos claros, caminhos de escalonamento e ações de recuperação. Ideal para construir runbooks de interrupções, integrar novos respondentes e padronizar o gerenciamento de incidentes.
Visão geral
O que é o incident-runbook-templates?
O incident-runbook-templates é uma skill do GitHub criada para ajudar equipes de engenharia e operações a elaborar runbooks de resposta a incidentes estruturados e acionáveis. Esses templates orientam os respondentes nas etapas de detecção, triagem, mitigação, resolução e comunicação durante interrupções de serviço ou incidentes operacionais. A skill é ideal para equipes que gerenciam sistemas críticos, integram novos engenheiros de plantão ou padronizam procedimentos de escalonamento em múltiplos projetos.
Quem deve usar esta skill?
- Engenheiros de confiabilidade de site (SREs)
- Equipes DevOps
- Gerentes de engenharia
- Respondentes de plantão
- Qualquer pessoa responsável pelo gerenciamento operacional de incidentes
Quais problemas ela resolve?
O incident-runbook-templates atende à necessidade de orientações claras e passo a passo durante incidentes de alta pressão. Ele ajuda as equipes a:
- Documentar ações de recuperação e caminhos de escalonamento
- Construir runbooks específicos para serviços em casos de interrupções, problemas de banco de dados e mais
- Padronizar procedimentos de resposta entre equipes
- Reduzir a dificuldade de integração de novos respondentes
Como usar
Passos para instalação
- Adicione a skill ao seu agente ou projeto com:
npx skills add https://github.com/wshobson/agents --skill incident-runbook-templates - Revise os arquivos principais:
SKILL.md(documentação principal da skill)README.md,AGENTS.md,metadata.json(se presentes)- Explore quaisquer pastas
rules/,resources/,references/ouscripts/para materiais de suporte
Adaptando os templates
- Comece lendo o
SKILL.mdpara entender os níveis de severidade e a estrutura do runbook - Personalize os templates para se adequar às ferramentas da sua equipe, matriz de escalonamento e restrições operacionais
- Use a tabela de níveis de severidade para definir tempos de resposta e categorias de impacto para seu ambiente
Quando esta skill é indicada?
- Você precisa criar ou melhorar a documentação de resposta a incidentes
- Sua equipe não possui runbooks padronizados para interrupções comuns
- Você quer integrar novos engenheiros com guias claros e acionáveis
Quando não é indicada?
- Você já possui runbooks completos e atualizados
- Sua resposta a incidentes é totalmente automatizada e não requer procedimentos manuais
Perguntas frequentes
Onde encontro os principais templates de runbook?
Abra a aba Files e visualize o SKILL.md para acessar os templates principais e orientações sobre níveis de severidade.
Posso usar o incident-runbook-templates para qualquer tipo de incidente?
Sim, os templates foram projetados para serem adaptados a vários tipos de incidentes, incluindo interrupções de serviço, falhas de banco de dados e problemas de infraestrutura.
Como personalizo os caminhos de escalonamento e ações de recuperação?
Edite as seções do template em SKILL.md para refletir a matriz de escalonamento, pontos de contato e procedimentos de recuperação da sua equipe.
Qual arquivo é recomendado para começar?
Comece pelo SKILL.md para obter uma visão geral dos níveis de severidade e da estrutura do runbook, depois explore os arquivos de suporte conforme necessário.
