incident-runbook-templates
por wshobsonincident-runbook-templates ayuda a los equipos a crear runbooks de respuesta a incidentes estructurados con procedimientos claros, rutas de escalamiento y acciones de recuperación. Ideal para construir runbooks de interrupciones, incorporar responsables y estandarizar la gestión de incidentes.
Descripción general
¿Qué es incident-runbook-templates?
incident-runbook-templates es una skill de GitHub diseñada para ayudar a los equipos de ingeniería y operaciones a crear runbooks de respuesta a incidentes estructurados y prácticos. Estas plantillas guían a los responsables a través de los pasos de detección, clasificación, mitigación, resolución y comunicación durante interrupciones de servicio o incidentes operativos. La skill es ideal para equipos que gestionan sistemas críticos, incorporan nuevos ingenieros de guardia o estandarizan procedimientos de escalamiento en múltiples proyectos.
¿Quién debería usar esta skill?
- Ingenieros de confiabilidad del sitio (SREs)
- Equipos de DevOps
- Gerentes de ingeniería
- Responsables de guardias
- Cualquier persona encargada de la gestión operativa de incidentes
¿Qué problemas resuelve?
incident-runbook-templates cubre la necesidad de contar con guías claras y paso a paso durante incidentes de alta presión. Ayuda a los equipos a:
- Documentar acciones de recuperación y rutas de escalamiento
- Crear runbooks específicos para servicios en casos de interrupciones, problemas de base de datos y más
- Estandarizar procedimientos de respuesta entre equipos
- Reducir la curva de aprendizaje para nuevos responsables
Cómo usar
Pasos de instalación
- Añade la skill a tu agente o proyecto con:
npx skills add https://github.com/wshobson/agents --skill incident-runbook-templates - Revisa los archivos principales:
SKILL.md(documentación principal de la skill)README.md,AGENTS.md,metadata.json(si están presentes)- Explora las carpetas
rules/,resources/,references/oscripts/para materiales complementarios
Adaptación de plantillas
- Comienza leyendo
SKILL.mdpara entender los niveles de severidad y la estructura del runbook - Personaliza las plantillas para ajustarlas a las herramientas, matriz de escalamiento y restricciones operativas de tu equipo
- Usa la tabla de niveles de severidad para definir tiempos de respuesta y categorías de impacto en tu entorno
¿Cuándo es adecuada esta skill?
- Necesitas crear o mejorar la documentación de respuesta a incidentes
- Tu equipo no cuenta con runbooks estandarizados para interrupciones comunes
- Quieres incorporar nuevos ingenieros con guías claras y prácticas
¿Cuándo no es adecuada?
- Ya cuentas con runbooks completos y actualizados
- Tu respuesta a incidentes está completamente automatizada y no requiere procedimientos manuales
Preguntas frecuentes
¿Dónde puedo encontrar las plantillas principales de runbooks?
Abre la pestaña de Archivos y revisa SKILL.md para acceder a las plantillas centrales y la guía de niveles de severidad.
¿Puedo usar incident-runbook-templates para cualquier tipo de incidente?
Sí, las plantillas están diseñadas para adaptarse a diversos tipos de incidentes, incluyendo interrupciones de servicio, fallos en bases de datos y problemas de infraestructura.
¿Cómo personalizo las rutas de escalamiento y las acciones de recuperación?
Edita las secciones de la plantilla en SKILL.md para reflejar la matriz de escalamiento, puntos de contacto y procedimientos de recuperación de tu equipo.
¿Cuál es el archivo recomendado para comenzar?
Empieza con SKILL.md para obtener una visión general de los niveles de severidad y la estructura del runbook, luego explora los archivos complementarios según sea necesario.
