service-mesh-observability

作成者 wshobson

service-mesh-observability は、Istio、Linkerd などのサービスメッシュで可観測性を設計するための実践的なスキルです。レイテンシ、エラー、サービス依存関係を対象に、メッシュのメトリクス、トレース、ダッシュボード、アラート、SLO を定義する際に役立ちます。

スター32.6k

お気に入り0

追加日2026年3月30日

カテゴリーObservability

インストールコマンド

npx skills add wshobson/agents --skill service-mesh-observability

編集スコア

このスキルの評価は 68/100 です。サービスメッシュの監視、トレーシング、トラブルシュートについて、読み応えのあるリファレンスを求めるディレクトリ利用者には掲載価値があります。一方で、ツール類、導入手順、判断ルールまで整った実行向けワークフローというより、ドキュメント中心のガイドとして捉えるのが適切です。

68/100

強み

高い想起性: frontmatter と「When to Use This Skill」セクションにより、サービスメッシュにおけるセットアップ、デバッグ、SLO、可視化のユースケースが明確に整理されています。
内容の厚みが十分: スキル本文はボリュームがあり、分散トレーシング、メトリクス、ログ、golden signals、メッシュのトラブルシュートといった具体的な可観測性トピックを、プレースホルダーではなく実質的な内容で扱っています。
メッシュ横断で使いやすい: Istio、Linkerd、各種サービスメッシュ環境を明示的に対象としており、一般的な運用環境で再利用しやすい構成です。

注意点

実行可能な資産がないため、運用面の明確さには限界があります。実装時の手探りを減らすためのスクリプト、参照リソース、補助資料、インストールコマンドは含まれていません。
リポジトリ上の根拠を見ると、ワークフローや制約条件の示し方は限定的です。そのため、環境ごとの手順、しきい値、前提条件は、エージェント側で補って判断する必要が残る可能性があります。

Service Mesh Istio Linkerd Prometheus Grafana Metrics Service Level Objectives

概要

service-mesh-observability スキルの概要

service-mesh-observability スキルは、Istio、Linkerd などのサービスメッシュ環境で、オブザーバビリティを設計・運用するための実践的なガイドです。特に、サービス間トラフィック全体にわたって信頼できるメトリクス、トレース、ログを整備したいプラットフォームエンジニア、SRE、DevOps チームに向いています。単に「何を見ればよいか」を手探りで探すのではなく、メッシュトラフィックのレイテンシ、エラー、依存関係の問題を可視化できるシグナル、ダッシュボード、アラートを定義し、それを障害対応や SLO 運用につなげるのがこのスキルの主な役割です。汎用的なオブザーバビリティ論ではなく、メッシュ固有の観点で golden signals、依存関係の可視化、分散トレーシングを組み立てられる点が差別化ポイントです。

service-mesh-observability スキルを使うべき人

サービスメッシュを運用していて、メッシュのトラフィック特性に沿ってトレーシング、メトリクス、ダッシュボード、SLO を体系立てて設計したい場合に適しています。

すぐに解決しやすい課題

どのメッシュシグナルを優先して見るべきか、レイテンシやエラーのホットスポットをどう検知するか、メッシュ依存関係を前提にダッシュボードをどう構成するかを整理できます。

カバーが弱い領域

ベンダー固有のセットアップスクリプトや helm chart は提供しません。ガイダンスを適用する前提として、サービスメッシュとオブザーバビリティ基盤はすでに存在している必要があります。

汎用的な observability プロンプトとの違い

service-mesh-observability スキルは、ホストレベル監視よりも、メッシュの golden signals、トラフィック起点の SLO、依存関係の可視化を優先して設計されています。

service-mesh-observability スキルの使い方

service-mesh-observability のインストールと有効化

次のコマンドでスキルをインストールします。
npx skills add https://github.com/wshobson/agents --skill service-mesh-observability
インストール後は、ほかのスキルと同様にエージェントのワークフローへ読み込んで使います。

最初に読むべきファイル

まず plugins/cloud-infrastructure/skills/service-mesh-observability/SKILL.md を開いてください。ここに、いつ使うべきか、3 本柱の考え方、メッシュ固有シグナルといった中核の判断軸がまとまっています。

効果を出すために必要な入力

メッシュの種類（Istio、Linkerd）、トラフィックパターン（RPS、重要サービス）、現在のオブザーバビリティ構成（Prometheus、Grafana、Jaeger など）、そして可能であれば SLO 目標を渡してください。

ざっくりした目的を強いプロンプトに変える

Weak: “Set up mesh monitoring.”
Strong: “Design service-mesh-observability for Istio with Prometheus/Grafana/Jaeger. Focus on P99 latency > 500ms alerts, error-rate spikes, and dependency graphs for checkout and payments. We need SLOs for internal API calls.”

実運用に載せるためのおすすめワークフロー

重要なメッシュサービスと主要なトラフィックフローを洗い出す。
メッシュの golden signals（traffic、latency、errors、saturation）を SLO に対応付ける。
トレーシングのカバレッジとサンプリング戦略を決める。
P50/P99 とエラー率に対するダッシュボードとアラートしきい値を定義する。
障害シナリオ（レイテンシ急増、サービス間障害）で妥当性を確認する。

出力品質を大きく上げるコツ

どのサービスがビジネス上クリティカルか、何を「悪い状態」とみなすか（例: P99 > 500ms）を明示してください。トラフィックの実態と SLO の期待値が具体的なほど、service-mesh-observability スキルは実用的なダッシュボードやアラートを返しやすくなります。

service-mesh-observability スキル FAQ

service-mesh-observability スキルは初心者にも向いていますか？

はい。ただし、すでにサービスメッシュを運用していることが前提です。何を測るべきかの整理には役立ちますが、最低限のオブザーバビリティ基盤があることを想定しています。

どんな場合は使わないほうがよいですか？

サービスメッシュを使っていない場合や、必要なのがノードレベルの監視だけである場合は避けたほうがよいです。その場合は、より汎用的な observability プランのほうが適しています。

通常の observability プロンプトと何が違いますか？

通常のプロンプトは単にメトリクスを列挙するだけになりがちですが、このスキルはサービス間の振る舞いと依存関係の見通しを軸に、メッシュ固有のシグナルとトレースを整理します。

ツールやベンダーは指定されますか？

いいえ。メッシュの考え方や見るべきシグナルには触れますが、特定のベンダーツールを前提にはしていません。

すでに本番運用中の Observability スタックに対する service-mesh-observability にも使えますか？

はい。既存のダッシュボードやアラートに抜け漏れがないか監査し、メッシュの golden signals に沿って整合させる用途で特に有効です。

service-mesh-observability スキルを改善する方法

サービス境界とオーナーシップを具体的に渡す

どのサービスが重要で、誰がオーナーなのかを明記してください。そうすることで、実際のエスカレーション経路に合ったアラートやダッシュボードを提案しやすくなります。

SLO と障害しきい値を最初に定義する

“P99 > 500ms for 5 minutes” や “error rate > 1%” のようなしきい値を先に提示してください。service-mesh-observability スキルは、それを基に実際に使えるアラートへ落とし込みます。

避けたい典型的な失敗パターン

“monitor latency” のような曖昧な入力では、出力も汎用的になりがちです。代わりに、レイテンシのパーセンタイル、トラフィックのベースライン、依存チェーンを具体的に指定してください。

障害事例を使って改善を回す

最初の出力を得たら、直近の障害や既知の失敗パターンに当てはめて検証し、次のように改善依頼を出してください。
“Which signals would have detected X faster?”

重要サービスから始めてメッシュ全体へ広げる

まずは価値の高い中核サービスに絞り、主要シグナルが安定してから依存グラフや namespace をまたぐトラフィック可視化へ拡張すると進めやすくなります。

可視化の助言が必要なら明示的に依頼する

トポロジービューが必要なら、その旨をはっきり伝えてください。たとえば “dependency graph dashboards for checkout → inventory → payments” と依頼すると、メッシュ前提の可視化アドバイスを得やすくなります。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

configuring-suricata-for-network-monitoring

作成者 mukul975

configuring-suricata-for-network-monitoring は、Suricata を IDS/IPS 監視、EVE JSON ログ出力、ルール管理、SIEM 向け出力に対応させるための導入・調整を支援するスキルです。実運用に近いセットアップ、検証、誤検知の削減が必要な Security Audit ワークフローで、configuring-suricata-for-network-monitoring を活用したい場合に適しています。

Security Audit

お気に入り 0GitHub 0

auditing-tls-certificate-transparency-logs

作成者 mukul975

auditing-tls-certificate-transparency-logsスキルは、セキュリティチームが自組織保有ドメインのCertificate Transparencyログを監視し、未承認の証明書発行を検出し、証明書が露出しているサブドメインを発見し、疑わしいCAの動きを再現可能なSecurity Auditワークフローで追跡するのに役立ちます。

Security Audit

お気に入り 0GitHub 0

analyzing-docker-container-forensics

作成者 mukul975

analyzing-docker-container-forensics は、イメージ、レイヤー、ボリューム、ログ、実行時アーティファクトを分析して、侵害された Docker コンテナの調査を支援し、悪意ある活動の特定と証拠保全を行います。Security Audit、インシデントレビュー、コンテナ強化の評価にこの analyzing-docker-container-forensics skill を使用してください。

Security Audit

お気に入り 0GitHub 0

aws-serverless-eda

作成者 zxkane

aws-serverless-eda は、AWS のサーバーレスとイベント駆動アーキテクチャにおけるバックエンド開発のためのガイドです。Lambda API、非同期ワークフロー、マイクロサービス、キュー、pub/sub、オーケストレーションを、API Gateway、DynamoDB、Step Functions、EventBridge、SQS、SNS と組み合わせて設計する際に役立ちます。Well-Architected を踏まえた意思決定、可観測性、セキュリティ、デプロイの規律を重視しています。

Backend Development

お気に入り 0GitHub 0

sentry

作成者 openai

sentry skillは、Sentryのissue、イベント、ヘルスシグナルを確認するための読み取り専用Observabilityツールです。直近の本番エラーの調査、影響範囲の要約、構造化出力を伴うCLIベースの再現可能なクエリ実行に使えます。広い観測性の全体像よりも、トリアージ向けの実用的なsentryガイドが欲しいときに最適です。

Observability

お気に入り 0GitHub 0

datadog-cli

作成者 softaworks

datadog-cliは、ログ、トレース、メトリクス、サービス、ダッシュボード向けのDatadog CLIワークフローをエージェントで実行するためのスキルです。DD_API_KEYとDD_APP_KEYを使ったセットアップ、`npx @leoflores/datadog-cli`コマンドの使い方、`--site`の指定方法、インシデントトリアージ時にダッシュボード更新を安全に進めるポイントを確認できます。

Observability

お気に入り 0GitHub 0

building-cloud-siem-with-sentinel

作成者 mukul975

building-cloud-siem-with-sentinel は、Microsoft Sentinel をクラウド SIEM および SOAR レイヤーとして導入するための実践ガイドです。マルチクラウドのログ取り込み、KQL による検知、インシデント調査、Security Audit や SOC 運用向けの Logic Apps レスポンスプレイブックを扱います。集中型のクラウドセキュリティ監視に、リポジトリを基点にした出発点が必要なときに、この building-cloud-siem-with-sentinel スキルを使ってください。

Security Audit

お気に入り 0GitHub 0

aws-cost-operations

作成者 zxkane

aws-cost-operations は、AWS のコスト見積もり、請求書の確認、CloudWatch の監視、CloudTrail のチェック、運用判断の支援に使える AWS コスト・運用スキルです。Finance、FinOps、プラットフォームチーム、そして検証済みの AWS 情報と意思決定に使える出力を必要とする運用担当者に適しています。

Finance

お気に入り 0GitHub 0

canary-watch

作成者 affaan-m

canary-watch は、リリース、マージ、依存関係更新のあとに、本番またはステージングのライブ URL をチェックして回帰を検出するためのデプロイ後監視スキルです。

Monitoring

お気に入り 0GitHub 156.1k

python-observability

作成者 wshobson

python-observability は、構造化ログ、メトリクス、トレース、Correlation ID、bounded-cardinality の実践パターンを使って、Python サービスを本番運用向けに計測し、デバッグしやすさと安全なオブザーバビリティ導入を支援します。

Observability

お気に入り 0GitHub 32.6k

prometheus-configuration

作成者 wshobson

prometheus-configuration は、Kubernetes、Docker Compose、各種サーバー環境で Prometheus を導入・運用するためのガイドです。スクレイピング設定、保存期間、アラート、recording rules までを幅広く扱えます。

Observability

お気に入り 0GitHub 32.6k

appinsights-instrumentation

作成者 github

appinsights-instrumentation は、Azure でホストされる Web アプリに Application Insights を組み込むためのスキルです。App Service の自動インストルメンテーションに加え、ASP.NET Core や Node.js での手動セットアップにも対応し、connection string の設定や IaC の更新ポイントまで案内します。

Observability

お気に入り 0GitHub 27.8k

analyzing-security-logs-with-splunk

作成者 mukul975

analyzing-security-logs-with-splunk は、Windows、ファイアウォール、プロキシ、認証ログを時系列と証拠に結び付けながら、Splunk でセキュリティイベントを調査するのに役立ちます。Security Audit、インシデント対応、脅威ハンティングに実用的な analyzing-security-logs-with-splunk のスキルガイドです。

Security Audit

お気に入り 0GitHub 6.1k

azure-monitor-opentelemetry-ts

作成者 microsoft

azure-monitor-opentelemetry-ts は、Azure Monitor と OpenTelemetry を使って Node.js アプリに分散トレース、メトリクス、ログを組み込むのに役立ちます。この azure-monitor-opentelemetry-ts スキルを使えば、パッケージのインストール、APPLICATIONINSIGHTS_CONNECTION_STRING の設定、自動計測を正しく動かすための起動順序まで、必要な手順をまとめて確認できます。

Observability

お気に入り 0GitHub 2.3k

conducting-cloud-incident-response

作成者 mukul975

conducting-cloud-incident-response は、AWS、Azure、GCP 向けのクラウドインシデント対応スキルです。ID ベースの封じ込め、ログレビュー、リソース分離、フォレンジック証拠の保全に重点を置いています。API の不審な操作、アクセスキーの侵害、クラウド上のワークロード侵害など、実践的な conducting-cloud-incident-response ガイドが必要な場面で使えます。

Incident Response

お気に入り 0GitHub 0

building-threat-intelligence-platform

作成者 mukul975

MISP、OpenCTI、TheHive、Cortex、STIX/TAXII、Elasticsearch を使って、脅威インテリジェンス・プラットフォームを設計、導入、レビューするための building-threat-intelligence-platform スキルです。インストールの指針、運用フロー、リポジトリ参照やスクリプトに基づく Security Audit の計画に活用できます。

Security Audit

お気に入り 0GitHub 0