W
slo-implementation
作者 wshobson
使用 slo-implementation skill 來定義可靠性工作的 SLI、SLO、錯誤預算與 burn-rate 警示。它能協助團隊把服務目標轉成可衡量的指標,並提供 PromQL 風格範例與來自 SKILL.md 的實務指引。
可靠性
收藏 0GitHub 32.6k
作者 wshobson
使用 slo-implementation skill 來定義可靠性工作的 SLI、SLO、錯誤預算與 burn-rate 警示。它能協助團隊把服務目標轉成可衡量的指標,並提供 PromQL 風格範例與來自 SKILL.md 的實務指引。
作者 wshobson
prometheus-configuration 可協助你在 Kubernetes、Docker Compose 與一般伺服器環境中安裝並使用 Prometheus,處理 metrics 擷取、資料保留、警示與 recording rules 設定。
作者 wshobson
grafana-dashboards 可協助代理為可觀測性場景規劃可用於正式環境的 Grafana 儀表板。可用來設計 RED 與 USE 架構、決定面板層級,並為 Prometheus 風格指標擬定儀表板結構。
作者 wshobson
使用 distributed-tracing 技能,搭配 Jaeger 與 Tempo 設計並說明微服務之間的請求追蹤。內容涵蓋安裝基礎、trace 與 span 概念、Kubernetes 部署模式、context propagation,以及用於可觀測性與延遲除錯的實務用法。
作者 wshobson
service-mesh-observability 是一項實用技能,適合用於在 Istio、Linkerd 與其他 service mesh 中設計可觀測性。你可以用它規劃 mesh 指標、追蹤、儀表板、警示與 SLO,掌握延遲、錯誤與服務相依關係。