Reliability

Kham pha Agent Skill cho Reliability trong Bao mat va so sanh workflow, cong cu va tinh huong lien quan.

8 skills
W
error-handling-patterns

bởi wshobson

error-handling-patterns giúp các nhóm chọn giữa exceptions và Result types, phân loại lỗi, truyền ngữ cảnh và thiết kế graceful degradation để API và dịch vụ vận hành đáng tin cậy hơn.

Reliability
Yêu thích 1GitHub 32.6k
W
python-resilience

bởi wshobson

python-resilience là skill hướng dẫn giúp xử lý lỗi trong Python an toàn hơn với retry, exponential backoff, jitter, timeout và giới hạn thời gian retry. Hãy dùng skill này để triển khai các mẫu resilience thực tế cho các external call và áp dụng các wrapper kiểu tenacity với quy tắc retry rõ ràng hơn.

Reliability
Yêu thích 0GitHub 32.6k
W
slo-implementation

bởi wshobson

Dùng kỹ năng slo-implementation để xác định SLI, SLO, error budget và cảnh báo burn-rate cho công việc Reliability. Kỹ năng này giúp nhóm biến mục tiêu dịch vụ thành các chỉ số đo lường được, với ví dụ theo kiểu PromQL và hướng dẫn thực tế từ SKILL.md.

Reliability
Yêu thích 0GitHub 32.6k
W
istio-traffic-management

bởi wshobson

istio-traffic-management giúp nhóm soạn các chính sách lưu lượng Istio như VirtualService, DestinationRule, Gateway và ServiceEntry cho canary, retries, circuit breaking và mirroring. Dùng nó để chuyển ý định triển khai thành các manifest định tuyến và khả năng chịu lỗi rõ ràng, kèm prompt thực dụng và điểm kiểm tra khi review.

Deployment
Yêu thích 0GitHub 32.6k
W
linkerd-patterns

bởi wshobson

linkerd-patterns giúp các nhóm áp dụng những mẫu triển khai Linkerd cho workload Kubernetes, bao gồm mTLS, sidecar injection, traffic splits, retries, timeouts, service profiles và lập kế hoạch multi-cluster cho các đợt rollout dựa trên Deployment.

Deployment
Yêu thích 0GitHub 32.6k
W
on-call-handoff-patterns

bởi wshobson

Tìm hiểu skill on-call-handoff-patterns để bàn giao ca trực ổn định và đáng tin cậy. Dùng skill này để chuẩn hóa bàn giao sự cố, ghi lại vấn đề đang mở, thay đổi gần đây, trạng thái leo thang xử lý và các bước tiếp theo cho đội Reliability.

Reliability
Yêu thích 0GitHub 32.5k
W
incident-runbook-templates

bởi wshobson

incident-runbook-templates giúp các nhóm xây dựng runbook ứng phó sự cố có cấu trúc rõ ràng, với các bước phân loại ban đầu, giảm thiểu tác động, leo thang, truyền thông và khôi phục cho sự cố gián đoạn và Playbooks vận hành.

Playbooks
Yêu thích 0GitHub 32.5k
S
upgrade-stripe

bởi stripe

Hướng dẫn upgrade-stripe để nâng cấp phiên bản Stripe API, các SDK phía server, Stripe.js và SDK di động trong các codebase thực tế, kèm các bước làm việc thực tiễn cho Backend Development.

Backend Development
Yêu thích 0GitHub 1.5k
Reliability agent skills