agent-introspection-debugging

作成者 affaan-m

agent-introspection-debugging スキルは、AI エージェントの失敗に対して構造化された自己デバッグのワークフローを提供します。失敗状態を記録し、原因候補を特定し、範囲を限定した回復ステップを適用し、人間が読める introspection レポートを出力します。ループしやすい実行、再試行が多い処理、挙動がずれやすい処理に向いており、通常の検証用途には適していません。

スター156k

お気に入り0

追加日2026年4月15日

カテゴリーDebugging

インストールコマンド

npx skills add affaan-m/everything-claude-code --skill agent-introspection-debugging

編集スコア

このスキルは 81/100 点です。エージェントの失敗に対して、明確に発火させやすい自己デバッグのワークフローを備えており、ディレクトリ掲載用として十分に実用的な情報量があります。ループ、挙動のずれ、繰り返し失敗する実行に対して、構造化された回復手順を導入したい利用者には導入価値がありますが、付属ファイルが少ないことと、適用範囲が限定的である点は確認しておくべきです。

81/100

強み

繰り返し失敗、ループ制限、トークン消費、挙動のずれ、回復可能なツール不具合に対する明確な起動条件がある。
失敗の記録、診断、範囲を限定した回復、レポート作成の 4 段階ワークフローが具体的で、エージェントの判断の迷いを減らせる。
運用上の位置づけが明快で、これは隠れた実行時機能ではなく、エスカレーション前の自己デバッグ用ワークフローだと明示している。

注意点

スクリプト、参照資料、サポートファイルは含まれていないため、利用者は SKILL.md のワークフローのみに依存する必要がある。
コード変更後の機能検証や、より狭いフレームワーク固有のデバッグなど、いくつかの用途は明示的に除外されており、適用範囲は広くない。

Ai Agents Workflow Claude Code Context

概要

agent-introspection-debugging スキルの概要

agent-introspection-debugging は何に使うスキルか

agent-introspection-debugging は、失敗している、ループしている、進展なくリトライを繰り返している、あるいはタスクから脱線している AI エージェント向けの、構造化された自己デバッグワークフローです。単にモデルへ「もっと頑張って」と促すのではなく、いったん停止し、失敗時点の状態を記録し、あり得る原因を切り分け、小さな回復アクションを 1 つだけ実行し、読みやすいデバッグレポートを出す流れへ導きます。

このスキルを導入すべき人

このスキルは、ツール、ファイル、実行環境をまたぐ複数ステップの AI ワークフローをすでに運用している開発者、エージェント構築者、運用担当者に向いています。特に効果を発揮するのは、問題が純粋なロジック不備ではなく運用面にあるケースです。たとえば、同じツールの誤用を繰り返す、コンテキストが膨らみすぎる、環境が想定とずれる、リトライループから抜け出せない、といった状況です。汎用的なデバッグ用プロンプトを 1 つ増やすのではなく、再利用できる回復手順がほしいなら、agent-introspection-debugging は有力な選択肢です。

通常のプロンプトと何が違うか

最大の違いは、暴走を抑え込む「封じ込め」にあります。このスキルは、根拠のない再試行を止め、何が起きたかを記録し、トークンを浪費する拡大的な対応ではなく、より小さく限定された修正アクションを選ばせます。同時に適用範囲も明確です。用途はエージェントの失敗からの回復であり、機能全体の検証や、より狭い専用スキルの方が強いフレームワーク固有のデバッグを置き換えるものではありません。

agent-introspection-debugging スキルの使い方

導入時の前提と最初に読むべき場所

affaan-m/everything-claude-code リポジトリで普段使っている skills 導入フローを通じて、agent-introspection-debugging をインストールします。その後、まず skills/agent-introspection-debugging/SKILL.md を読んでください。このリポジトリでは、スキルの実体がほぼそのファイルに集約されており、重要な挙動を左右する追加スクリプトや参照アセットは見当たりません。つまり、導入判断では「自動化が足りないかどうか」ではなく、そのワークフロー自体が自分の運用に合うかを確認するのがポイントです。

agent-introspection-debugging を呼び出すべきタイミング

agent-introspection-debugging は、実行が失敗したあと、または品質が目に見えて劣化したあとに使うのが適しています。特に次のようなケースです。

loop-limit や max-tool-call に達して失敗した
リトライを繰り返しているのに前進がない
prompt drift やコンテキスト肥大化で出力品質が落ちている
filesystem や環境の状態が想定と食い違っている
ツール実行に失敗しているが、診断して次の一手を狭めれば回復できそう

通常のコーディングフローのデフォルトとして常時使うものではありません。エージェントが明らかに脱線したあと、規律ある回復が必要な場面でこそ価値が出ます。

どんな入力だと良い出力になりやすいか

このスキルに渡すべきなのは、「debug this」のような曖昧な依頼ではなく、要点を絞った failure packet です。良い入力には通常、次が含まれます。

元のゴール
期待していた結果
実際の失敗内容
最後に意味のあった tool-call の並び
関連するエラーテキストや stack trace
失敗直前に変わったこと
「1 ファイル以上は編集しない」「ネットワークアクセス禁止」のような現在の制約

例のプロンプト:
“Use agent-introspection-debugging for Debugging. Goal: update auth middleware tests. Expected: green test run. Actual: agent retried npm test 6 times, then edited unrelated files. Error: MODULE_NOT_FOUND in tests/auth.spec.ts. Last useful actions: edited jest.config.js, ran tests, listed files. Constraints: no dependency upgrades, keep changes minimal. Produce failure capture, diagnosis, one contained recovery action, and a short introspection report.”

この形が有効なのは、ノイズに引っ張られず、根本原因と周辺症状を切り分けるのに十分な証拠をスキルへ渡せるからです。

実践的な運用フローと期待できる出力

良い agent-introspection-debugging usage パターンは、次の流れです。

明確な失敗パターンが現れてから起動する
新しい編集やリトライの前に、必ず failure capture をさせる
広範囲な書き換えではなく、限定された回復アクションを 1 つだけ求める
エージェントを再開させる前に、introspection report を確認する

実運用では、このスキルは「次の一手を狭める」ときに最も力を発揮します。たとえば、環境前提を確認する、疑わしいファイルを 1 つだけ調べる、悪影響のある変更を 1 つだけ戻す、といった使い方です。「全部まとめてデバッグして」と依頼すると、このスキルの価値である封じ込め効果が薄れてしまいます。

agent-introspection-debugging スキル FAQ

普通のデバッグ用プロンプトより優れていますか？

多くの場合は yes です。特に、問題の中心がコード欠陥そのものではなく、エージェントの振る舞いにあるときに向いています。通常のプロンプトは、かえってリトライを増やしがちです。agent-introspection-debugging skill は、ループを止め、失敗時の証拠を保全し、人間が短時間で確認できるレポートを出させる点で優れています。

agent-introspection-debugging は初心者にも向いていますか？

初心者でも使えますが、prompt drift、ツールループ、environment mismatch といった症状をある程度見分けられると、より効果的です。まだ不慣れでも、このスキルにはチェックリスト的な構造があるため助けになります。ただし、漠然とした説明だけを渡すより、具体的な失敗の証拠を添えたほうが結果は明らかに良くなります。

agent-introspection-debugging を使わないほうがよい場面は？

定常的なコード検証、最終 QA、あるいは専用スキルが存在する狭いフレームワークデバッグには使わないほうがよいです。また、現在の harness 内では明らかに回復不能な問題、たとえば不足している権限や、セッション内からはどうにもできないインフラ停止のようなケースでも適しません。

リポジトリには自動化がありますか、それともガイダンス中心ですか？

このスキルについては、リポジトリ上の根拠は SKILL.md にあるガイダンスが中心で、helper script や rule file は見当たりません。これは必ずしも弱点ではありませんが、agent-introspection-debugging install だけで自動的に強制される仕組みは得られない、という意味ではあります。導入するのは「ツール」そのものというより、エージェントがきちんと守るべきワークフローです。

agent-introspection-debugging スキルを改善するには

長いプロンプトより、良い証拠を渡す

出力品質に最も効くのは、失敗の捉え方を鋭くすることです。正確な停止地点、失敗したコマンド、直前の編集、そして制約を含めてください。関係のない履歴は省きます。モデルがノイズを読み込まずに、意図した行動と実際の軌跡を比較できるほど、agent-introspection-debugging guide の質は上がります。

診断と回復を分けて依頼する

よくある失敗は、診断を飛ばして即座の修復に潰してしまうことです。agent-introspection-debugging usage を改善するには、次を明示的に要求してください。

あり得る失敗パターン
確信度
最小の次アクション
そのアクション後の成功確認方法

こうしておくと、症状から大きな推測修正へ飛びつくのを防げます。

封じ込めルールで再被害を防ぐ

過去の実行でリポジトリの状態が悪化したなら、次のような制限を追加してください。

編集前にまず調査する
変更は最大 1 ファイル
新しい証拠なしに同じコマンドを繰り返さない
次のアクションが、単なるリトライより安全な理由を要約する

これらの制約は、agent-introspection-debugging for Debugging の狙いと強く一致しています。つまり、回復可能性を保ちながら、無駄なアクションを減らすことです。

最初のレポートを改善し、最初からやり直さない

最初の introspection report が弱くても、まったく新しいプロンプトでやり直さないでください。足りない部分だけを絞って改善させます。たとえば、「root cause candidates を言い直して」「evidence と assumptions を分けて」「より小さい recovery action を提案して」といった依頼です。このほうが構造化されたループを維持でき、スキル自体を放棄するより、2 回目で良い結果が出やすくなります。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

systematic-debugging

作成者 obra

systematic-debugging は、バグ、flaky tests、ビルド失敗、予期しない挙動に対して、根本原因の特定を最優先に進めるデバッグスキルです。修正提案に入る前に確認したい、4フェーズのワークフロー、補助ファイル、適した利用場面を把握できます。

Debugging

お気に入り 0GitHub 121.8k

hunt

作成者 tw93

hunt は、修正に着手する前に必ず根本原因を考えるよう促す、デバッグ優先の skill です。エラー、クラッシュ、リグレッション、テスト失敗、キャッシュの古さに起因する不具合、スクリーンショットのバグ、「以前は動いていたのに」起きる障害に使えます。検証可能な仮説を立て、証拠を集め、勘に頼るのを避けるのに役立ちます。コードレビューや新機能向けではありません。

Debugging

お気に入り 0GitHub 5.1k

typescript-magician

作成者 mcollina

typescript-magician は、難易度の高い TypeScript の課題を解決するのに役立ちます。深いジェネリック設計、厳格な型付けの整理、コンパイルエラー、型ガード、高度な型変換まで幅広く対応します。型安全なコード生成、`any` の除去、`infer`、条件型、マップ型、テンプレートリテラル型、ブランド型、ユーティリティ型が必要なときの typescript-magician の使い方に向いています。

Code Generation

お気に入り 0GitHub 1.8k

web-perf

作成者 cloudflare

web-perf は Chrome DevTools MCP を使って Web パフォーマンスを分析します。Core Web Vitals、トレースベースの読み込み問題、レンダリングを妨げるリソース、レイアウトシフト、キャッシュの問題、アクセシビリティのギャップを測定します。Performance Optimization、遅いページのデバッグ、そして最新ドキュメントと実際のトレースに基づく web-perf のガイド型ワークフローに使ってください。

Performance Optimization

お気に入り 0GitHub 1.3k

playwright-best-practices

作成者 currents-dev

playwright-best-practices は、安定したテスト作成、flake の削減、認証フローの改善、fixtures と page objects の使い分け、さらに CI・popups・mobile・iframes・websockets・multi-user シナリオへの対応まで、実践的なリポジトリ根拠に基づいて学べる Playwright + TypeScript 向けスキルです。

Test Automation

お気に入り 0GitHub 174

autofix

作成者 coderabbitai

autofix は、CodeRabbit の PR レビューコメントを、現在の GitHub ブランチ上で検証済みのコード変更へ安全に変換するのを支援します。明示的な承認を前提にした、ブランチ対応の CodeRabbit 用 Code Review ワークフローが必要なときに使ってください。単なるプロンプト追従型の修正ツールではありません。リポジトリの状態を確認し、信頼できる指示を読み取り、検証済みの修正だけを適用します。

Code Review

お気に入り 0GitHub 0

sentry

作成者 openai

sentry skillは、Sentryのissue、イベント、ヘルスシグナルを確認するための読み取り専用Observabilityツールです。直近の本番エラーの調査、影響範囲の要約、構造化出力を伴うCLIベースの再現可能なクエリ実行に使えます。広い観測性の全体像よりも、トリアージ向けの実用的なsentryガイドが欲しいときに最適です。

Observability

お気に入り 0GitHub 0

aspire

作成者 github

Deployment 向けの aspire skill について、インストール、AppHost のセットアップ、ローカル実行、ダッシュボードでのデバッグ、公開ワークフローまでを解説します。CLI の使い方、参考情報、トラブルシューティングに加え、publish と deploy の重要な境界も押さえています。

Deployment

お気に入り 0GitHub 0

property-based-testing

作成者 trailofbits

property-based-testing のスキルガイドです。言語やスマートコントラクトにまたがる PBT の作成、レビュー、改善に役立ちます。この property-based-testing ガイドでは、ラウンドトリップ、冪等性、不変条件、パーサー、バリデーター、正規化の観点を見つけ、ジェネレーターを選び、property-based-testing が例ベースのテストより有効かどうかを判断できます。

Skill Testing

お気に入り 0GitHub 5k

terminal-ops

作成者 affaan-m

terminal-ops は、ターミナル作業向けの証拠重視のリポジトリ実行スキルです。コマンドの実行、git 状態の確認、CI やビルドのデバッグ、そして何が変わり何を検証したかを示しながら、最小限の修正を行う用途に使えます。この terminal-ops ガイドは、Code Editing やリポジトリ操作での迷いを減らすのに役立ちます。

Code Editing

お気に入り 0GitHub 156.3k

investigate

作成者 garrytan

investigate skill は、壊れた動作、挙動が不安定な不具合、想定外の動作に対して、体系的なデバッグと根本原因分析を進めるためのガイドです。コードレビュー、障害切り分け、バグ修正、そして「昨日までは動いていた」といったケースで、コードを変える前に証拠を集めたいときに使います。investigate、analyze、hypothesize、implement の 4 段階ワークフローに従います。

Code Review

お気に入り 0GitHub 91.8k

browser-testing-with-devtools

作成者 addyosmani

browser-testing-with-devtools は、Chrome DevTools MCP を通じて実ブラウザの挙動をテスト・デバッグするための skill です。DOM の確認、コンソールエラーの取得、ネットワークリクエストの解析、パフォーマンスのプロファイル、ライブブラウザでの修正確認に使えます。

Test Automation

お気に入り 0GitHub 18.7k

libfuzzer

作成者 trailofbits

libFuzzerは、ClangでコンパイルされたC/C++プロジェクト向けのカバレッジ誘導型ファザーです。このlibFuzzerスキルは、対象のハーネス化、サニタイザの実行、最小限のセットアップで実践的なセキュリティ監査を始めるための導入と使い方を整理し、インストールから理解・運用までをサポートします。

Security Audit

お気に入り 0GitHub 5k

vue-debug-guides

作成者 vuejs-ai

vue-debug-guides は、Vue 3 のランタイムエラー、警告、async component の失敗、リアクティビティの不具合、SSR や hydration の不一致を診断し、参考資料に基づく的確な修正策を提示するデバッグ用スキルです。

Debugging

お気に入り 0GitHub 2.1k

ios-simulator-skill

作成者 conorluddy

ios-simulator-skill は、アクセシビリティを意識したアプリ起動、画面遷移、テキスト入力、ジェスチャー、スクリーンショット取得、状態保存、build/testループ、Simulator のライフサイクル制御までをまとめて扱える、タスク特化型の iOS Simulator skill です。AI エージェント、QA エンジニア、開発者が、再現性の高い iOS テスト自動化を進める際の迷いを減らすよう設計されています。

Test Automation

お気に入り 0GitHub 0

datadog-cli

作成者 softaworks

datadog-cliは、ログ、トレース、メトリクス、サービス、ダッシュボード向けのDatadog CLIワークフローをエージェントで実行するためのスキルです。DD_API_KEYとDD_APP_KEYを使ったセットアップ、`npx @leoflores/datadog-cli`コマンドの使い方、`--site`の指定方法、インシデントトリアージ時にダッシュボード更新を安全に進めるポイントを確認できます。

Observability

お気に入り 0GitHub 0