Skill Validation

スキル構築 で Skill Validation に関連する Agent Skill を探し、近いワークフローや用途を比較できます。

31 件のスキル
A
springboot-verification

作成者 affaan-m

springboot-verification は、Spring Boot プロジェクトの変更が PR やデプロイ前に安全かどうかを確認するための検証ループです。この springboot-verification ガイドでは、ビルド検証、静的解析、カバレッジ付きテスト、セキュリティスキャン、Skill Validation を扱います。

Skill Validation
お気に入り 0GitHub 156.3k
A
santa-method

作成者 affaan-m

santa-method は、公開前に正確さが求められる出力のためのマルチエージェント検証ワークフローです。独立したレビューで、コンテンツ、コード周辺の成果物、コンプライアンスに配慮が必要な文面、ワークフロー自動化タスクに潜む見落としを検出します。生成・検証・収束を繰り返す再現性の高いループが必要なら、santa-method スキルを導入してください。

Workflow Automation
お気に入り 0GitHub 156.2k
A
rules-distill

作成者 affaan-m

rules-distillは、Skill Authorsやprompt libraryのキュレーター向けの保守系skillです。インストール済みのskillsをスキャンし、繰り返し現れるパターンを再利用可能なrulesに落とし込み、一般的なレビュー用promptよりも迷いの少ない形でrule filesの追加・修正・作成を支援します。

Skill Authoring
お気に入り 0GitHub 156.2k
A
eval-harness

作成者 affaan-m

eval-harness は、Claude Code セッションと eval 主導開発のための正式な評価フレームワークです。合格/不合格の基準を定義し、機能評価や回帰評価を構築し、プロンプトやワークフローの変更を公開する前にエージェントの信頼性を測定するのに役立ちます。

Model Evaluation
お気に入り 0GitHub 156.1k
A
continuous-learning-v2

作成者 affaan-m

continuous-learning-v2 は、Claude Code のセッションを hooks、observer agents、confidence scoring、そして繰り返しパターンを skills・commands・agents に昇格させる仕組みによって、プロジェクト単位の学習へ変えるスキルです。

Skill Authoring
お気に入り 0GitHub 156.1k
A
context-budget

作成者 affaan-m

context-budget スキルは、Claude Code のコンテキスト使用量を agents、skills、rules、MCP servers を横断して監査します。肥大化した内容、重複コンテンツ、コストの高い要素を特定し、優先度付きの整理アクションを返します。実用的な context-budget の使い方や、大規模構成での Skill Testing にこのガイドを活用してください。

Skill Testing
お気に入り 0GitHub 156.1k
A
agent-sort

作成者 affaan-m

agent-sort は、証拠に基づく ECC インストール計画を作成するための、リポジトリ対応の skill です。skills、commands、rules、hooks、extras を DAILY と LIBRARY に仕分け、プロジェクトで実際に使うものだけをインストールできるようにします。インストール判断、agent-sort の使い方、Skill Authoring ワークフロー向けの実践的な agent-sort ガイドとして活用してください。

Skill Authoring
お気に入り 0GitHub 156k
O
writing-skills

作成者 obra

writing-skills は、エージェントスキルの作成・編集・検証をテスト駆動のワークフローで進めるための Skill Authoring ガイドです。主要ファイル、前提条件、プレッシャーシナリオ、ベースラインテスト、簡潔な SKILL.md を反復改善する実践手順を把握できます。

Skill Authoring
お気に入り 0GitHub 121.9k
O
verification-before-completion

作成者 obra

verification-before-completionは、裏付けのない完了報告を防ぐための最終確認スキルです。どんな場面で使うべきか、obra/superpowersからの導入方法、そして修正完了・テスト通過・レビュー可能といった各ステータスの主張を最新の検証結果にどう対応づけるかを確認できます。

Skill Validation
お気に入り 0GitHub 121.9k
A
skill-creator

作成者 anthropics

skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。

Skill Authoring
お気に入り 2GitHub 105.1k
W
evaluation-methodology

作成者 wshobson

evaluation-methodologyは、Model EvaluationにおけるPluginEvalの採点方法を解説するスキルです。評価レイヤー、ルーブリック、合成スコア、バッジ閾値に加え、結果の読み解き方や弱い評価軸の改善に役立つ実践的な指針を確認できます。

Model Evaluation
お気に入り 0GitHub 32.6k
M
context-degradation

作成者 muratcankoylan

context-degradation は、長いワークフローで起きる文脈障害を診断するための実用的なスキルです。途中の文脈喪失、poisoning、distraction、confusion、clash などを含め、どこで文脈が崩れるのかを特定し、最初に何を変えるべきかを判断し、Skill Authoring、プロンプト配置、本番エージェントのデバッグに使える再現性のある context-degradation ガイドを適用できます。

Skill Authoring
お気に入り 0GitHub 15.6k
M
context-fundamentals

作成者 muratcankoylan

context-fundamentals は、AI エージェントシステムのためのコンテキストエンジニアリングを実践的に学べるガイドです。プロンプトに何を入れるべきかの判断、コンテキスト関連の問題のデバッグ、より明確なコンテキスト構造によるトークン予算の管理に役立ちます。エージェント設計やプロンプト最適化に向けて、実践的な context-fundamentals ガイドが必要なときに使うスキルです。

Context Engineering
お気に入り 0GitHub 15.6k
Y
skill-builder

作成者 yusufkaraaslan

skill-builderは、Skill Seekersを使って、ドキュメント、GitHubリポジトリ、PDF、動画、コードベースをAI対応のskillsへ変換するためのskill authoring支援です。ソース種別の判定、推奨ワークフロー、ツールベースの手順を備えており、単発のプロンプト頼みではなく、再現性のあるskill作成を行えます。

Skill Authoring
お気に入り 0GitHub 13.5k
T
testing-handbook-generator

作成者 trailofbits

testing-handbook-generator は、Trail of Bits の Testing Handbook(appsec.guide)から Claude Code のスキルを作成するためのメタスキルです。スキル作成者、セキュリティエンジニア、メンテナーが、ハンドブックの各セクションを再利用可能なスキルへ落とし込めるように、明確なワークフロー、スコープ管理、再現性のある生成手順を支援します。ハンドブックからスキルへ変換するための testing-handbook-generator ガイドが必要なときに使ってください。

Skill Authoring
お気に入り 0GitHub 5k
T
audit-prep-assistant

作成者 trailofbits

audit-prep-assistantは、Trail of Bitsのチェックリストを使ってSecurity Auditに向けたコードベースの準備を支援するskillです。レビュー目標の整理、静的解析の実行、テストカバレッジの向上、不要コードの削除、リスクの文書化、補助資料の生成までをサポートし、よりスムーズな監査引き継ぎにつなげます。

Security Audit
お気に入り 0GitHub 4.9k
D
create-skill-test

作成者 dotnet

create-skill-test は、dotnet/skills のエージェント向けスキル用に `eval.yaml` のテストファイルを作成するためのスキャフォールドを提供します。スキルテストの作成、シナリオやフィクスチャ、アサーション、ルーブリックの定義に使え、評価設計における過学習の抑制にも役立ちます。既存テストの実行、validator エラーのデバッグ、`SKILL.md` ファイルの作成には向きません。

Skill Testing
お気に入り 0GitHub 3k
D
create-skill

作成者 dotnet

create-skill は、dotnet/skills スタイルで新しいエージェントスキルを作成するためのスキャフォールド生成ツールです。適切なスキルフォルダを作成し、frontmatter 付きの SKILL.md を生成し、Skill Scaffolding のリポジトリ規約に沿って進めるのに役立ちます。既存スキルの編集よりも、新規スキル作成に向いています。

Skill Scaffolding
お気に入り 0GitHub 3k
M
skill-optimizer

作成者 mcollina

skill-optimizer は、AI スキルの起動性、明確さ、モデル間の信頼性を高めたい作者向けの支援スキルです。Skill Authoring において、スキルは書けているのに安定して従われない場合、トリガーが弱い場合、リグレッションが出る場合、コンテキストコストを削りたい場合に適しています。ベンチマークの反復、リリースゲート、使用忠実度の向上をサポートします。

Skill Authoring
お気に入り 0GitHub 1.8k
S
skill-judge

作成者 softaworks

skill-judge は、AI skill パッケージと SKILL.md ファイルを監査するためのレビュー・採点用 skill です。知識差分、起動条件の明確さ、ワークフロー品質、公開準備の整い具合を評価し、改善に直結する具体的なフィードバックを提供します。

Skill Validation
お気に入り 0GitHub 1.3k
N
judge

作成者 NeoLabHQ

Judge は2段階の評価 skill です。まず meta-judge を起動し、その後に judge sub-agent が isolated context、evidence、明確な criteria に基づいて作業を採点します。コード、文章、分析、または Skill Authoring をレポート専用でレビューしたいときに、気軽な意見ではなく、説明可能な judge guide が必要ならこれを使います。

Skill Authoring
お気に入り 0GitHub 982
N
do-and-judge

作成者 NeoLabHQ

do-and-judge skill は、サブエージェントによる実装、独立した judge、そして合格するか最大再試行回数に達するまで再試行で検証する、単一タスク実行型の skill です。明確な受け入れ基準、切り分けられた実行、一般的なプロンプトよりも少ない推測で進めたい Workflow Automation に適しています。

Workflow Automation
お気に入り 0GitHub 982
A
llm-patterns

作成者 alinaqi

llm-patterns は、LLM が推論・抽出・生成を担い、コードが検証・ルーティング・エラー処理を担う、AIファーストなアプリケーションロジックの設計を支援します。より明確なプロンプト構造、テスト可能な LLM ワークフロー、Skill Authoring に役立つ実践的なガイダンスを得るために、この llm-patterns スキルを活用してください。

Skill Authoring
お気に入り 0GitHub 607
A
darwin-skill

作成者 alchaincyf

darwin-skillは、SKILL.mdファイルを「評価→改善→テスト→採用または差し戻し」の反復ループで改善できるスキルです。Skill Authoring向けに作られており、ルーブリック採点とプロンプトベースの検証を組み合わせ、repoのテンプレートやアセットから視覚的な結果出力にも対応します。

Skill Authoring
お気に入り 0GitHub 549
Skill Validation agent skills