作成者 affaan-m
springboot-verification は、Spring Boot プロジェクトの変更が PR やデプロイ前に安全かどうかを確認するための検証ループです。この springboot-verification ガイドでは、ビルド検証、静的解析、カバレッジ付きテスト、セキュリティスキャン、Skill Validation を扱います。
作成者 affaan-m
springboot-verification は、Spring Boot プロジェクトの変更が PR やデプロイ前に安全かどうかを確認するための検証ループです。この springboot-verification ガイドでは、ビルド検証、静的解析、カバレッジ付きテスト、セキュリティスキャン、Skill Validation を扱います。
作成者 affaan-m
santa-method は、公開前に正確さが求められる出力のためのマルチエージェント検証ワークフローです。独立したレビューで、コンテンツ、コード周辺の成果物、コンプライアンスに配慮が必要な文面、ワークフロー自動化タスクに潜む見落としを検出します。生成・検証・収束を繰り返す再現性の高いループが必要なら、santa-method スキルを導入してください。
作成者 affaan-m
rules-distillは、Skill Authorsやprompt libraryのキュレーター向けの保守系skillです。インストール済みのskillsをスキャンし、繰り返し現れるパターンを再利用可能なrulesに落とし込み、一般的なレビュー用promptよりも迷いの少ない形でrule filesの追加・修正・作成を支援します。
作成者 affaan-m
eval-harness は、Claude Code セッションと eval 主導開発のための正式な評価フレームワークです。合格/不合格の基準を定義し、機能評価や回帰評価を構築し、プロンプトやワークフローの変更を公開する前にエージェントの信頼性を測定するのに役立ちます。
作成者 affaan-m
continuous-learning-v2 は、Claude Code のセッションを hooks、observer agents、confidence scoring、そして繰り返しパターンを skills・commands・agents に昇格させる仕組みによって、プロジェクト単位の学習へ変えるスキルです。
作成者 affaan-m
context-budget スキルは、Claude Code のコンテキスト使用量を agents、skills、rules、MCP servers を横断して監査します。肥大化した内容、重複コンテンツ、コストの高い要素を特定し、優先度付きの整理アクションを返します。実用的な context-budget の使い方や、大規模構成での Skill Testing にこのガイドを活用してください。
作成者 affaan-m
agent-sort は、証拠に基づく ECC インストール計画を作成するための、リポジトリ対応の skill です。skills、commands、rules、hooks、extras を DAILY と LIBRARY に仕分け、プロジェクトで実際に使うものだけをインストールできるようにします。インストール判断、agent-sort の使い方、Skill Authoring ワークフロー向けの実践的な agent-sort ガイドとして活用してください。
作成者 obra
writing-skills は、エージェントスキルの作成・編集・検証をテスト駆動のワークフローで進めるための Skill Authoring ガイドです。主要ファイル、前提条件、プレッシャーシナリオ、ベースラインテスト、簡潔な SKILL.md を反復改善する実践手順を把握できます。
作成者 obra
verification-before-completionは、裏付けのない完了報告を防ぐための最終確認スキルです。どんな場面で使うべきか、obra/superpowersからの導入方法、そして修正完了・テスト通過・レビュー可能といった各ステータスの主張を最新の検証結果にどう対応づけるかを確認できます。
作成者 anthropics
skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。
作成者 wshobson
evaluation-methodologyは、Model EvaluationにおけるPluginEvalの採点方法を解説するスキルです。評価レイヤー、ルーブリック、合成スコア、バッジ閾値に加え、結果の読み解き方や弱い評価軸の改善に役立つ実践的な指針を確認できます。
作成者 muratcankoylan
context-degradation は、長いワークフローで起きる文脈障害を診断するための実用的なスキルです。途中の文脈喪失、poisoning、distraction、confusion、clash などを含め、どこで文脈が崩れるのかを特定し、最初に何を変えるべきかを判断し、Skill Authoring、プロンプト配置、本番エージェントのデバッグに使える再現性のある context-degradation ガイドを適用できます。
作成者 muratcankoylan
context-fundamentals は、AI エージェントシステムのためのコンテキストエンジニアリングを実践的に学べるガイドです。プロンプトに何を入れるべきかの判断、コンテキスト関連の問題のデバッグ、より明確なコンテキスト構造によるトークン予算の管理に役立ちます。エージェント設計やプロンプト最適化に向けて、実践的な context-fundamentals ガイドが必要なときに使うスキルです。
作成者 yusufkaraaslan
skill-builderは、Skill Seekersを使って、ドキュメント、GitHubリポジトリ、PDF、動画、コードベースをAI対応のskillsへ変換するためのskill authoring支援です。ソース種別の判定、推奨ワークフロー、ツールベースの手順を備えており、単発のプロンプト頼みではなく、再現性のあるskill作成を行えます。
作成者 trailofbits
testing-handbook-generator は、Trail of Bits の Testing Handbook(appsec.guide)から Claude Code のスキルを作成するためのメタスキルです。スキル作成者、セキュリティエンジニア、メンテナーが、ハンドブックの各セクションを再利用可能なスキルへ落とし込めるように、明確なワークフロー、スコープ管理、再現性のある生成手順を支援します。ハンドブックからスキルへ変換するための testing-handbook-generator ガイドが必要なときに使ってください。
作成者 trailofbits
audit-prep-assistantは、Trail of Bitsのチェックリストを使ってSecurity Auditに向けたコードベースの準備を支援するskillです。レビュー目標の整理、静的解析の実行、テストカバレッジの向上、不要コードの削除、リスクの文書化、補助資料の生成までをサポートし、よりスムーズな監査引き継ぎにつなげます。
作成者 dotnet
create-skill-test は、dotnet/skills のエージェント向けスキル用に `eval.yaml` のテストファイルを作成するためのスキャフォールドを提供します。スキルテストの作成、シナリオやフィクスチャ、アサーション、ルーブリックの定義に使え、評価設計における過学習の抑制にも役立ちます。既存テストの実行、validator エラーのデバッグ、`SKILL.md` ファイルの作成には向きません。
作成者 dotnet
create-skill は、dotnet/skills スタイルで新しいエージェントスキルを作成するためのスキャフォールド生成ツールです。適切なスキルフォルダを作成し、frontmatter 付きの SKILL.md を生成し、Skill Scaffolding のリポジトリ規約に沿って進めるのに役立ちます。既存スキルの編集よりも、新規スキル作成に向いています。
作成者 mcollina
skill-optimizer は、AI スキルの起動性、明確さ、モデル間の信頼性を高めたい作者向けの支援スキルです。Skill Authoring において、スキルは書けているのに安定して従われない場合、トリガーが弱い場合、リグレッションが出る場合、コンテキストコストを削りたい場合に適しています。ベンチマークの反復、リリースゲート、使用忠実度の向上をサポートします。
作成者 softaworks
skill-judge は、AI skill パッケージと SKILL.md ファイルを監査するためのレビュー・採点用 skill です。知識差分、起動条件の明確さ、ワークフロー品質、公開準備の整い具合を評価し、改善に直結する具体的なフィードバックを提供します。
作成者 NeoLabHQ
Judge は2段階の評価 skill です。まず meta-judge を起動し、その後に judge sub-agent が isolated context、evidence、明確な criteria に基づいて作業を採点します。コード、文章、分析、または Skill Authoring をレポート専用でレビューしたいときに、気軽な意見ではなく、説明可能な judge guide が必要ならこれを使います。
作成者 NeoLabHQ
do-and-judge skill は、サブエージェントによる実装、独立した judge、そして合格するか最大再試行回数に達するまで再試行で検証する、単一タスク実行型の skill です。明確な受け入れ基準、切り分けられた実行、一般的なプロンプトよりも少ない推測で進めたい Workflow Automation に適しています。
作成者 alinaqi
llm-patterns は、LLM が推論・抽出・生成を担い、コードが検証・ルーティング・エラー処理を担う、AIファーストなアプリケーションロジックの設計を支援します。より明確なプロンプト構造、テスト可能な LLM ワークフロー、Skill Authoring に役立つ実践的なガイダンスを得るために、この llm-patterns スキルを活用してください。
作成者 alchaincyf
darwin-skillは、SKILL.mdファイルを「評価→改善→テスト→採用または差し戻し」の反復ループで改善できるスキルです。Skill Authoring向けに作られており、ルーブリック採点とプロンプトベースの検証を組み合わせ、repoのテンプレートやアセットから視覚的な結果出力にも対応します。