incident-runbook-templates
bởi wshobsonincident-runbook-templates giúp các nhóm tạo các sổ tay phản ứng sự cố có cấu trúc rõ ràng với các quy trình, đường dẫn leo thang và hành động khôi phục cụ thể. Phù hợp để xây dựng sổ tay xử lý sự cố, đào tạo nhân viên phản ứng và chuẩn hóa quản lý sự cố.
Tổng quan
incident-runbook-templates là gì?
incident-runbook-templates là một kỹ năng GitHub được thiết kế để giúp các nhóm kỹ thuật và vận hành tạo ra các sổ tay phản ứng sự cố có cấu trúc và khả thi. Các mẫu này hướng dẫn nhân viên phản ứng qua các bước phát hiện, phân loại, giảm thiểu, giải quyết và truyền thông trong các sự cố gián đoạn dịch vụ hoặc vận hành. Kỹ năng này rất phù hợp cho các nhóm quản lý hệ thống quan trọng, đào tạo kỹ sư trực ca mới hoặc chuẩn hóa quy trình leo thang trên nhiều dự án.
Ai nên sử dụng kỹ năng này?
- Kỹ sư độ tin cậy hệ thống (SRE)
- Nhóm DevOps
- Quản lý kỹ thuật
- Nhân viên trực ca phản ứng
- Bất kỳ ai chịu trách nhiệm quản lý sự cố vận hành
Kỹ năng này giải quyết vấn đề gì?
incident-runbook-templates đáp ứng nhu cầu hướng dẫn rõ ràng, từng bước trong các sự cố áp lực cao. Nó giúp các nhóm:
- Ghi lại các hành động khôi phục và đường dẫn leo thang
- Xây dựng sổ tay dịch vụ cụ thể cho các sự cố gián đoạn, sự cố cơ sở dữ liệu và hơn thế nữa
- Chuẩn hóa quy trình phản ứng giữa các nhóm
- Giảm khó khăn khi đào tạo nhân viên phản ứng mới
Cách sử dụng
Các bước cài đặt
- Thêm kỹ năng vào agent hoặc dự án của bạn bằng lệnh:
npx skills add https://github.com/wshobson/agents --skill incident-runbook-templates - Xem xét các tệp chính:
SKILL.md(tài liệu kỹ năng chính)README.md,AGENTS.md,metadata.json(nếu có)- Khám phá các thư mục
rules/,resources/,references/, hoặcscripts/để tìm tài liệu hỗ trợ
Điều chỉnh mẫu
- Bắt đầu bằng cách đọc
SKILL.mdđể hiểu các mức độ nghiêm trọng và cấu trúc sổ tay - Tùy chỉnh mẫu để phù hợp với công cụ, ma trận leo thang và giới hạn vận hành của nhóm bạn
- Sử dụng bảng mức độ nghiêm trọng để xác định thời gian phản hồi và các loại tác động trong môi trường của bạn
Khi nào kỹ năng này phù hợp?
- Bạn cần xây dựng hoặc cải thiện tài liệu phản ứng sự cố
- Nhóm bạn thiếu các sổ tay chuẩn cho các sự cố phổ biến
- Bạn muốn đào tạo kỹ sư mới với hướng dẫn rõ ràng và khả thi
Khi nào không phù hợp?
- Bạn đã có sổ tay đầy đủ, cập nhật
- Phản ứng sự cố của bạn hoàn toàn tự động và không cần quy trình thủ công
Câu hỏi thường gặp
Tôi có thể tìm các mẫu sổ tay chính ở đâu?
Mở tab Files và xem trước SKILL.md để tìm các mẫu cốt lõi và hướng dẫn mức độ nghiêm trọng.
Tôi có thể dùng incident-runbook-templates cho mọi loại sự cố không?
Có, các mẫu được thiết kế để điều chỉnh cho nhiều loại sự cố khác nhau, bao gồm gián đoạn dịch vụ, lỗi cơ sở dữ liệu và sự cố hạ tầng.
Làm sao để tùy chỉnh đường dẫn leo thang và hành động khôi phục?
Chỉnh sửa các phần mẫu trong SKILL.md để phản ánh ma trận leo thang, điểm liên hệ và quy trình khôi phục của nhóm bạn.
Tệp nào được khuyến nghị bắt đầu?
Bắt đầu với SKILL.md để có cái nhìn tổng quan về mức độ nghiêm trọng và cấu trúc sổ tay, sau đó khám phá các tệp hỗ trợ khi cần.
