create-skill-test

作成者 dotnet

create-skill-test は、dotnet/skills のエージェント向けスキル用に `eval.yaml` のテストファイルを作成するためのスキャフォールドを提供します。スキルテストの作成、シナリオやフィクスチャ、アサーション、ルーブリックの定義に使え、評価設計における過学習の抑制にも役立ちます。既存テストの実行、validator エラーのデバッグ、`SKILL.md` ファイルの作成には向きません。

スター3k

お気に入り0

追加日2026年5月25日

カテゴリーSkill Testing

インストールコマンド

npx skills add dotnet/skills --skill create-skill-test

編集スコア

このスキルの評価は 62/100 で、掲載は可能ですが注意して検討すべき内容です。`eval.yaml` のテストファイルを組み立てる実用的で目的特化のワークフローはありますが、汎用性は高くなく、より広く再利用できるスキルというよりリポジトリ固有の性格が強いです。

62/100

強み

トリガー条件が明確です。フロントマターで、`eval.yaml` のテストファイル作成、シナリオ追加、フィクスチャ設定、過学習リスクの確認に使うと明示されています。
運用面で具体的です。入力内容、使う場面・使わない場面の指針、制約付きの複数ステップ手順が本文に含まれています。
dotnet/skills のコントリビューターにとって導入判断の材料が十分です。validator チェックやリポジトリの規約に触れているため、一般的なプロンプトより手探りが少なく済みます。

注意点

実験的・テスト志向の内容で、dotnet/skills の規約に強く依存しているため、そのリポジトリ外ではそのまま転用しにくい可能性があります。
スクリプト、参照資料、サポートファイルは含まれていないため、実装の詳細はこのドキュメントだけを頼りに進める必要があります。

Test Template Docs Developer Audience Dotnet

概要

`create-skill-test` skill の概要

create-skill-test は、dotnet/skills リポジトリでエージェント用スキルの eval.yaml テストファイルを作るための、足場作成と検証を支援するツールです。目的は「テストを書いて」といった一般的なプロンプトではなく、スキルテストのための信頼できる出発点が必要な人に向けたものです。主な役割は、対象スキル、プラグイン名、シナリオ案を、慣例に沿った安全なテスト構造に変換し、fixture、assertion、rubric を過度に特定実装へ寄せずに組み立てることです。

create-skill-test は、どのスキルを評価したいかはすでに分かっていて、リポジトリのルールに合うテストファイルを素早く作りたい作者に最適です。テストを実行したいだけのとき、validator の失敗をデバッグしたいとき、あるいは SKILL.md をゼロから書きたいときには、あまり向いていません。

`create-skill-test` は何のためのものか

新しい eval ファイルを作るとき、既存の eval にシナリオを追加するとき、あるいは rubric がたった 1 つの出力例にだけ強く依存していないか確認したいときに、create-skill-test を使います。テスト設計の品質が YAML の形と同じくらい重要な create-skill-test for Skill Testing のワークフローでは、とくに有効です。

何を避ける助けになるか

最大の価値は、壊れやすい eval を避けられることです。具体的には、必須フィールドの欠落、skill path の不一致、fixture の整理不足、そして実際の挙動ではなく言い回しだけを評価してしまう rubric の文言などです。対象スキルが進化してもテストを有用に保ちたいなら、ここは重要です。

何を置き換えないか

skill-validator の代わりにはなりませんし、SKILL.md ファイルの編集を助けるものでもありません。壊れたテスト実行の原因を特定したい、あるいは validator の出力をデバッグしたいなら、これは使うべきツールではありません。

`create-skill-test` skill の使い方

インストールして元スキルを開く

npx skills add dotnet/skills --skill create-skill-test で create-skill-test をインストールします。次に最初に SKILL.md を読みます。モデルに何かを生成させる前に、ワークフロー、入力要件、そして依頼が有効かどうかを決める境界条件がそこに書かれているからです。

適切なテストブリーフを与える

強い create-skill-test install の依頼は、単に「テストを作って」ではありません。スキル名、プラグイン名、検証したい挙動、シナリオ上の制約を含めてください。スキルは plugins/<plugin>/skills/ 配下にある対象を前提にしているため、名前の正確さが重要です。

より良いブリーフの例は次のとおりです。

Skill: foo-bar
Plugin: dotnet-msbuild
Goal: エージェントが有効な summary を作成し、未対応の path を拒否することを確認する
Scenario: 初回利用者で、前提情報が一部しかない
Fixture need: 最小構成の入力ファイル 1 つと、エッジケース用ファイル 1 つ

これだけの構造があれば、create-skill-test usage の流れは、ただの一般的な eval ではなく、実用的なものを組み立てやすくなります。

重要なリポジトリの節を読む

まず SKILL.md を読み、その後に README.md、AGENTS.md、metadata.json、さらに近くに rules/、resources/、references/、scripts/ フォルダがあれば、それらも確認してください。このリポジトリのスナップショットでは表示されているのが SKILL.md だけなので、skill 定義そのものが主な一次情報になります。

シナリオと rubric を反復調整する

最初の下書きで、テストが本当に意図した挙動を測れているか確認します。rubric が文言を褒めるだけで結果を見ていないなら、基準を絞ってください。シナリオが広すぎるなら分割してください。スキルに本当に必要なのが 1 つの成功経路だけなら、余計なケースを作らず、eval は小さく保つほうがよいです。

`create-skill-test` skill の FAQ

`create-skill-test` は `dotnet/skills` 専用ですか？

はい、dotnet/skills リポジトリの慣例と plugins/<plugin>/skills/ 配置を前提に設計されています。ほかの場所にも応用はできますが、リポジトリ構造と validation の期待値が同じときに、create-skill-test のガイドは最も価値を発揮します。

普通のプロンプトの代わりに使うべきですか？

再現性のある eval の足場を作り、構造上のミスを減らしたいなら create-skill-test を使ってください。普通のプロンプトでもテスト内容は説明できますが、リポジトリ固有の慣例、fixture の置き場所、過剰適合のチェックについては、たいてい弱くなります。

初心者にも向いていますか？

はい。対象スキルを特定できて、シナリオを平易な言葉で説明できるなら使えます。逆に、プラグイン名、スキルの path、検証したい挙動を言えない場合は初心者向けとは言いにくいです。というのも、それらの入力が生成結果を直接左右するからです。

どんなときに使わないほうがいいですか？

テストの実行、validator エラーのデバッグ、新しい skill の作成には使わないでください。これらは隣接するワークフローですが、使うツールも成功条件も異なります。

`create-skill-test` skill を改善する方法

入力をもっと絞る

create-skill-test の成果がよくなるのは、広い意図よりも具体的なシナリオを与えたときです。「コンテキスト不足を処理して安全な fallback を返すことをテストしたい」は、「包括的な eval を作ってほしい」よりもはるかに強い指示です。なぜなら、どの挙動が重要で、何を過剰に評価してはいけないかがはっきりするからです。

YAML だけでなく rubric の質も求める

構造だけを頼むと、形式上は正しくても過剰適合したファイルが返ることがあります。何を成功とみなすのか、何を失敗とみなすのか、どの詳細が本質的でどれが付随的なのかを明示してください。それが create-skill-test for Skill Testing の結果を最短で改善する方法です。

生成後に過剰適合を確認する

assertion が、1 つの言い回し、固定順序、あるいは完全一致の例文だけを評価していないか確認してください。そうした細かさが本当に必要な場合を除き、良い eval は 1 回の実行で出た文言そのものではなく、スキルが維持すべき挙動を測ります。

validator のフィードバックで絞り込む

最初の出力が validation に失敗したら、正確なエラー内容とその周辺の YAML 断片をそのまま返してください。たいていは、依頼全体を言い直すよりも、その情報を使った 2 回目の出力のほうがよくなります。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

skill-creator

作成者 anthropics

skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。

Skill Authoring

お気に入り 2GitHub 105.1k

cpp-testing

作成者 affaan-m

cpp-testing skill は、GoogleTest、GoogleMock、CMake、CTest を使った C++ テストの作成・実行・デバッグを支援します。カバレッジ確認、フレイキーなテストの修正、サニタイザーによる診断、そして現代的な C++ プロジェクトでの実践的な cpp-testing の活用に役立ちます。

Test Automation

お気に入り 0GitHub 156.1k

test-driven-development

作成者 addyosmani

test-driven-development スキルは、まず失敗するテストを書き、その後で最小限の修正を加えて通すことでコード変更を進めるのに役立ちます。ロジック変更、バグ修正、回帰対策、そして「それらしい修正」よりも証拠が重要なエッジケースに適しています。

Skill Testing

お気に入り 0GitHub 18.8k

skill-optimizer

作成者 mcollina

skill-optimizer は、AI スキルの起動性、明確さ、モデル間の信頼性を高めたい作者向けの支援スキルです。Skill Authoring において、スキルは書けているのに安定して従われない場合、トリガーが弱い場合、リグレッションが出る場合、コンテキストコストを削りたい場合に適しています。ベンチマークの反復、リリースゲート、使用忠実度の向上をサポートします。

Skill Authoring

お気に入り 0GitHub 1.8k

property-based-testing

作成者 trailofbits

property-based-testing のスキルガイドです。言語やスマートコントラクトにまたがる PBT の作成、レビュー、改善に役立ちます。この property-based-testing ガイドでは、ラウンドトリップ、冪等性、不変条件、パーサー、バリデーター、正規化の観点を見つけ、ジェネレーターを選び、property-based-testing が例ベースのテストより有効かどうかを判断できます。

Skill Testing

お気に入り 0GitHub 5k

writing-skills

作成者 obra

writing-skills は、エージェントスキルの作成・編集・検証をテスト駆動のワークフローで進めるための Skill Authoring ガイドです。主要ファイル、前提条件、プレッシャーシナリオ、ベースラインテスト、簡潔な SKILL.md を反復改善する実践手順を把握できます。

Skill Authoring

お気に入り 0GitHub 121.9k

verification-loop

作成者 affaan-m

verification-loop は、コード変更後に build、type、lint、test、security、diff を確認するための Claude Code 向け検証ワークフローです。PR 前やリファクタリング後に、一般的なプロンプトではなく、整理された変更後チェックガイドが欲しいときに役立ちます。

Verification

お気に入り 0GitHub 156.3k

perl-testing

作成者 affaan-m

perl-testing は、Test2::V0、Test::More、prove、モック、カバレッジ、TDD を使って Perl テストを作成・実行・改善するための実践ガイドです。インストールの考え方、使い方のパターン、移行の手助け、失敗したテストスイートの迅速なデバッグに perl-testing スキルを活用できます。

Skill Testing

お気に入り 0GitHub 156.2k

kotlin-testing

作成者 affaan-m

kotlin-testing は、Kotest、MockK、コルーチンテスト、プロパティベーステスト、Kover によるカバレッジを使った Kotlin のテスト自動化を実践的に学べるガイドです。TDD に沿ったワークフローで、より分かりやすいユニットテストやコンポーネントテストを書き、依存関係のモック化やサスペンド関数のテストで迷いを減らすために、この kotlin-testing skill を活用できます。

Test Automation

お気に入り 0GitHub 156.2k

eval-harness

作成者 affaan-m

eval-harness は、Claude Code セッションと eval 主導開発のための正式な評価フレームワークです。合格/不合格の基準を定義し、機能評価や回帰評価を構築し、プロンプトやワークフローの変更を公開する前にエージェントの信頼性を測定するのに役立ちます。

Model Evaluation

お気に入り 0GitHub 156.1k

context-budget

作成者 affaan-m

context-budget スキルは、Claude Code のコンテキスト使用量を agents、skills、rules、MCP servers を横断して監査します。肥大化した内容、重複コンテンツ、コストの高い要素を特定し、優先度付きの整理アクションを返します。実用的な context-budget の使い方や、大規模構成での Skill Testing にこのガイドを活用してください。

Skill Testing

お気に入り 0GitHub 156.1k

skill-judge

作成者 softaworks

skill-judge は、AI skill パッケージと SKILL.md ファイルを監査するためのレビュー・採点用 skill です。知識差分、起動条件の明確さ、ワークフロー品質、公開準備の整い具合を評価し、改善に直結する具体的なフィードバックを提供します。

Skill Validation

お気に入り 0GitHub 1.3k

playwright-testing

作成者 alinaqi

Playwrightのエンドツーエンドテストを、page objects、クロスブラウザ実行、CI向けセットアップ、認証処理、安定したテスト構成で作成・デバッグするためのplaywright-testingスキルです。

Skill Testing

お気に入り 0GitHub 607

darwin-skill

作成者 alchaincyf

darwin-skillは、SKILL.mdファイルを「評価→改善→テスト→採用または差し戻し」の反復ループで改善できるスキルです。Skill Authoring向けに作られており、ルーブリック採点とプロンプトベースの検証を組み合わせ、repoのテンプレートやアセットから視覚的な結果出力にも対応します。

Skill Authoring

お気に入り 0GitHub 549

evaluation

作成者 muratcankoylan

evaluation スキルは、非決定論的なシステムに対してエージェント評価を設計・実行するためのものです。評価の導入計画、ルーブリック作成、回帰チェック、品質ゲート、Skill Testing の評価に使えます。LLM-as-judge のワークフロー、多面的なスコアリング、再現性のある結果が必要な実用的な評価運用に向いています。

Skill Testing

お気に入り 0GitHub 0

tutor

作成者 RoundTable02

tutorは、Obsidian StudyVaultユーザー向けのクイズ駆動型学習skillです。診断的な理解度チェック、概念レベルの復習、進捗トラッキングを行いたい人に向いています。言語を判定し、vaultを見つけ、ダッシュボードを読み取り、構造化されたセッションで弱点分野を重点的に演習します。一般的な雑談型の家庭教師ではなく、繰り返し使える学習チェックが必要なときに使うskillです。

Skill Authoring

お気に入り 0GitHub 0

create-skill-test

create-skill-test skill の概要

create-skill-test は何のためのものか

何を避ける助けになるか

何を置き換えないか

create-skill-test skill の使い方

インストールして元スキルを開く

適切なテストブリーフを与える

重要なリポジトリの節を読む

シナリオと rubric を反復調整する

create-skill-test skill の FAQ

create-skill-test は dotnet/skills 専用ですか？

普通のプロンプトの代わりに使うべきですか？

初心者にも向いていますか？

どんなときに使わないほうがいいですか？

create-skill-test skill を改善する方法

入力をもっと絞る

YAML だけでなく rubric の質も求める

生成後に過剰適合を確認する

validator のフィードバックで絞り込む

評価とレビュー

`create-skill-test` skill の概要

`create-skill-test` は何のためのものか

`create-skill-test` skill の使い方

`create-skill-test` skill の FAQ

`create-skill-test` は `dotnet/skills` 専用ですか？

`create-skill-test` skill を改善する方法