skill-creator

作成者 anthropics

skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。

スター105.1k

お気に入り2

追加日2026年3月28日

カテゴリーSkill Authoring

インストールコマンド

npx skills add anthropics/skills --skill skill-creator

編集スコア

このスキルの評価は 84/100 で、他のスキルを作成・改善・評価するための実運用フローを求めるユーザーに有力な候補です。リポジトリには複数段階の手順、評価用エージェント、実行可能なスクリプトが揃っており、単なる汎用プロンプトより高い実務価値が期待できます。一方で、SKILL.md にはシンプルな install 手順や quick-start command が明示されていないため、導入時にはある程度の読み解きや環境への組み込み判断が必要です。

95/100

強み

トリガー適合性が高く、新規スキル作成、既存スキルの編集、eval 実行、ばらつきのベンチマーク、説明改善によるトリガー精度向上まで、用途が明確に示されています。
実務面でのレバレッジが大きく、リポジトリには eval ループやレビュー向けの具体的なツールとして、run_eval.py、run_loop.py、aggregate_benchmark.py、package_skill.py、eval-viewer/generate_review.py が含まれています。
段階的な情報開示がうまく、analyzer・comparator・grader 各エージェント向けのドキュメントで、役割、入力、評価手順が明確に整理されています。

注意点

導入は完全に turnkey ではありません。SKILL.md には install command や簡潔な quick-start path がなく、スクリプトを自分の環境にどう組み込むかを利用者側で判断する必要があります。
単純な用途にはやや重めのワークフローに見えます。複数のスクリプト、エージェント、評価ステップを前提としており、求める内容によってはオーバースペックです。

Anthropic Claude Workflow Testing Documentation

概要

skill-creator skill の概要

skill-creator ができること

skill-creator は Skill Authoring 向けのメタスキルです。新しい skill の作成、既存 skill の改訂、さらにその変更で本当に挙動が改善したかの検証まで支援します。単なる「skill を書いて」と頼む汎用プロンプトとは異なり、skill-creator は反復ループを前提に設計されています。つまり、ドラフト作成、テスト、出力レビュー、バリアント比較、改善という流れを回していく使い方に向いています。

skill-creator を使うべき人

skill-creator が最も合うのは、繰り返し発生する agent の挙動を再利用可能な skill に落とし込みたい人です。

ラフなアイデアから始める skill author
弱い SKILL.md を改善したい maintainer
本格展開前に eval を追加したいチーム
適切な skill がより確実に発火するよう説明文を調整したい人

一度きりの prompt が欲しいだけなら、skill-creator はやや手順が多すぎる可能性があります。

本当に解決したい仕事

多くのユーザーが必要としているのは、単に markdown を書く支援ではありません。推測頼みを減らす支援です。

skill に何を含めるべきか
ユーザーから十分なコンテキストをどう集めるか
現実的な prompt でどうテストするか
出力を定性的・定量的にどうレビューするか
たまたま一度うまくいった結果に惑わされず、どう反復改善するか

このワークフロー重視こそが、skill-creator skill の大きな差別化ポイントです。

インストール前に目立つ点

このリポジトリは「すぐ scaffold を作ること」よりも、評価と反復改善に強みがあります。含まれているものは次のとおりです。

agents/ 内の evaluator 向け補助 agent
scripts/ 内の benchmark とレポート用スクリプト
eval-viewer/ と assets/ による HTML レビュー用ワークフロー
references/schemas.md の schema / reference 資料

そのため skill-creator は、最初のドラフトを生成するだけでなく、品質を測りながら改善したいときに特に有用です。

導入をためらう要因

主なトレードオフは複雑さです。skill-creator は、段階ごとに考え、テスト prompt、期待値、比較対象を用意する前提になっています。補助の Python スクリプトを実行できない環境や、出力を評価する予定がないケースでは、この skill の価値を一部しか使えません。

skill-creator skill の使い方

skills 環境に skill-creator をインストールする

Anthropic の skills CLI パターンを使っている場合は、upstream repo からインストールします。

npx skills add https://github.com/anthropics/skills --skill skill-creator

SKILL.md 内では別個の package installer は案内されていないため、多くのユーザーは monorepo から追加し、その後でローカルにインストールされたファイルを確認する流れになります。

まず読むべきファイル

素早く全体像をつかむなら、次の順で読むのがおすすめです。

skills/skill-creator/SKILL.md
skills/skill-creator/agents/grader.md
skills/skill-creator/agents/comparator.md
skills/skill-creator/agents/analyzer.md
skills/skill-creator/scripts/run_eval.py
skills/skill-creator/scripts/run_loop.py
skills/skill-creator/eval-viewer/generate_review.py
skills/skill-creator/references/schemas.md

この順番で読むと、実際の運用モデルが見えてきます。つまり、skill を生成または改訂し、eval を回し、出力を比較し、どのバージョンがなぜ勝ったのかを分析する、という流れです。

自分が今いる段階から始める

skill-creator skill は、新規 skill 作成専用ではありません。今どの段階にいるのかを明示して使うと、最も効果が出ます。

アイデア整理: 「課題はわかっているが、ワークフローが固まっていない」
初稿作成: 「このメモを使える SKILL.md にしてほしい」
修復: 「この skill は存在するが、これらの prompt で失敗する」
最適化: 「発火用の説明文と examples を改善したい」
評価設計: 「テスト prompt と期待値を設計したい」
比較: 「v1 と v2 を比較し、勝者の理由を説明してほしい」

ここを省くと、model が本来ではないフェーズに労力を使ってしまうことがあります。

skill-creator が本当に必要とする入力を渡す

質の高い skill-creator usage の prompt には、通常次の要素が含まれます。

対象ユーザーの job
将来の skill が受け取る入力
期待する出力や deliverable
skill が読んだり実行したりしてよい tools / files
レイテンシ、形式、安全性などの制約
すでに観測している失敗例
現実的なテスト prompt を 3〜10 個

品質が大きく伸びるのは、説明文を長くすることよりも、examples と failure case を良くすることが多いです。

ラフな目標を強い prompt に変える

弱い prompt:

Help me create a research skill.

より強い prompt:

Use skill-creator for Skill Authoring. I need a skill that turns a vague market question into a structured research brief with sources, assumptions, and open questions. Inputs are a user question and optional company context. Outputs should be a markdown brief. The skill may browse repository files but should not invent citations. Current failure modes: overlong answers, weak source framing, and missing assumptions. Please draft the skill, propose 6 eval prompts, and suggest measurable expectations for each.

こちらの方が優れているのは、task、I/O、constraints、failure modes が具体的に指定されているからです。

組み込みの評価ワークフローを使う

リポジトリを見る限り、skill-creator は単なるドラフト生成ではなく、反復的な評価を前提に設計されています。実運用では次の流れになります。

skill をドラフトする、または改訂する
小さな eval set を作る
実行する
transcript と出力をレビューする
期待値に照らして採点する
必要に応じてブラインドでバリアント比較する
再度 skill を改訂する

scripts/ 配下のファイルを見ると、意図されたワークフローが読み取れます。

run_eval.py は eval 実行用
aggregate_benchmark.py と generate_report.py は結果要約用
run_loop.py は反復改善サイクル用
quick_validate.py は高速な確認用
improve_description.py は trigger-description の調整用

HTML viewer で出力をレビューする

skill-creator install の実用的な差別化要素として、レビュー UI が同梱されています。eval-viewer/generate_review.py は、実行結果の workspace から自己完結型の HTML レビューページを生成し、フィードバックの保存もできます。これは、人手で複数の出力を確認する必要がある場面、特に transcript の質と最終成果物の両方が重要な skill で効いてきます。

この skill を採用するか検討しているなら、このレビュー用ツールはかなり強い判断材料になります。

comparator と grader agent を使って偏りの少ない改善を行う

特に価値が高い補助 agent は次の 2 つです。

agents/comparator.md は、どの skill が出した出力かを伏せたまま A/B 比較する
agents/grader.md は transcript と出力をもとに期待値をチェックし、甘い評価基準も批評する

つまり skill-creator は「この出力は良さそうか？」だけでなく、「そもそも eval は意味のある設計になっていたか？」まで問い直します。これは本気で skill を保守するうえで、かなり有用です。

本文だけでなく description も調整する

多くの skill author は instructions の中身に集中しすぎて、trigger に使われる冒頭 description への注意が不足しがちです。scripts/improve_description.py が存在すること自体、trigger 品質が想定ワークフローの一部であることを示しています。良い skill なのに安定して呼ばれないなら、改善すべきなのは次の点です。

description 内での問題設定
どんな状況で発火すべきか
どこまでを扱い、どこからを扱わないかの境界

既存の skill ライブラリに対して skill-creator skill を使ううえで、ここは特にレバレッジの高いポイントです。

実務上の限界を理解する

skill-creator は authoring と evaluation を構造化してくれますが、次のものを不要にはしません。

対象タスクに関するドメイン知識
現実的な eval case
出力が主観的な場合の人間の判断
同梱された Python utility を実行できる環境

現実的な prompt を用意できない、あるいは出力を確認できない場合、このプロセスの強みはかなり薄れます。

skill-creator skill の FAQ

skill-creator は初心者にも向いていますか？

はい。ただし注意点が 1 つあります。初心者でも skill-creator guide のワークフローを使えば、白紙状態から始めやすくなりますが、リポジトリ全体としては反復テストにある程度慣れていることを前提にしています。初めてなら、benchmarking scripts に手を出す前に、まずはドラフト作成と小さな eval set から始めるのがよいでしょう。

普通の prompt より skill-creator が優れている点は何ですか？

通常の prompt でも、それらしい初稿は得られるかもしれません。skill-creator が優れているのは、評価支援付きの、再現可能な作成・改善ループが必要なときです。本当の価値は最初の文章生成そのものより、周辺の方法論と補助ファイル群にあります。

どんなときは skill-creator を使わない方がいいですか？

次のケースでは見送るのが妥当です。

一度きりの prompt しか必要ない
出力をテストする予定がない
task が小さすぎて skill 化するほどではない
環境上、リポジトリの補助スクリプトや review flow を使えない

こうした場合は、直接 prompt を書いた方が速いです。

skill-creator は新規 skill にしか役立ちませんか？

いいえ。skill-creator skill は既存 skill の改訂、2 バージョンの benchmark 比較、発火精度を上げるための description 改善にも向いています。

すべてのスクリプトがないと価値は出ませんか？

いいえ。ドラフト作成や手動改訂だけでも skill-creator usage は役立ちます。ただし、通常の prompting を超える情報価値が最も大きいのは、評価スクリプトと viewer の部分です。

これは Anthropic の skills ecosystem 専用ですか？

skill の構造や用語を見る限り、その ecosystem を前提に設計されているのは明らかなので、最も相性が良いのはそこです。ただし、ドラフト、eval、比較、改訂というワークフロー自体は、他の社内 skill / agent framework にも十分応用できます。

skill-creator skill を改善する方法

タスク境界をより狭く定義する

skill-creator の出力品質を最も手早く改善する方法は、将来の skill が何を拒否し、何を無視すべきかを明確にすることです。境界がないと、ドラフトは広すぎて何にでも反応する設計になりがちです。prompt には「使うべき場面」と「使うべきでない場面」の例を入れてください。

現実的な eval prompt を早い段階で用意する

テストケース作成を後回しにしすぎるユーザーは多いです。skill-creator for Skill Authoring では、早い段階で eval prompt を作ることで、実際の task が何なのかが明確になります。良い eval は、skill を実際以上によく見せる整った例ではなく、現実のユーザー入力を反映しているべきです。

期待値をより強く書く

弱い期待値は、根拠のない安心感につながります。たとえば次のようなものでは不十分です。

“Output is clear”

代わりに、次のように書きます。

“Output includes a prioritized recommendation”
“Every cited claim links to a provided source”
“Result contains assumptions and open questions sections”

これは agents/grader.md の思想とも一致しています。このファイルでは、簡単に満たせてしまう assertion への警戒が明示されています。

変更差分が小さいならブラインド比較する

似たような 2 つのドラフトで迷っているなら、markdown を見比べるだけで決めないでください。ブラインド比較のパターンを使う方が有効です。文言の小さな変更でも、実行時の挙動に思った以上の差が出ることがあり、それは skill file だけ見ても読み切れません。

最終出力だけでなく transcript も確認する

見た目の整った最終回答でも、tool の使い方が悪い、読むべき file を見落としている、推論が弱い、といった問題を隠している場合があります。skill-creator の価値は、出力だけでなく transcript も一緒に見て、なぜそのバージョンが成功したのかを検討するときに高まります。これは analyzer agent の役割とも一致しています。

一度に 1 つの軸だけ改善する

信頼できる学びを得たいなら、description、instructions、examples、tool guidance を一度に全部書き換えないでください。1 つの軸だけ変え、安定した eval set を再実行し、その差分をレビューしましょう。こうすることで skill-creator guide のプロセスははるかに情報量の多いものになります。

リポジトリ内のファイルを運用手順として使う

結果が曖昧に感じるなら、SKILL.md を読み返すだけでは足りません。評価の振る舞いを定義している補助ファイルも確認してください。

agents/comparator.md は A/B レビューで何を「better」とみなすかを示す
agents/grader.md は pass/fail 判定の厳しさを示す
agents/analyzer.md は事後分析による改善のヒントを示す
references/schemas.md は期待される構造を示す

これらのファイルの方が、トップレベルの説明より実際の使い方を明確にしてくれることがよくあります。

最初の成功後に eval set を広げる

ありがちな失敗は、数回うまく動いた時点で止めてしまうことです。skill-creator skill は明確に反復的な拡張を前提として作られています。小さな set でドラフトが機能したら、次は prompt を広げて、edge case、曖昧な依頼、失敗しやすい例も含めてください。そこで初めて、その skill が頑健なのか、たまたま運が良かっただけなのかを見極められます。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

create-colleague

作成者 titanwings

create-colleague は、同僚に関するドキュメント、チャット、メール、スクリーンショット、Feishu、DingTalk のデータをもとに、編集可能な AI スキルを生成します。業務面と人物像を分けて出力でき、継続的に磨き込むための更新フローにも対応しています。

Skill Authoring

お気に入り 1GitHub 747

lean-ux-canvas

作成者 deanpeters

lean-ux-canvas は、Lean UX Canvas v2 を使って、チームがビジネス課題を整理し、仮説を洗い出し、次に何を学ぶべきかを明確にするのに役立ちます。ソリューション検討の前に実践的な lean-ux-canvas ガイドが必要なときの、ワークショップ準備、ステークホルダーとの認識合わせ、初期のプロダクト探索に適しています。

Skill Authoring

お気に入り 0GitHub 4.1k

documentation-lookup

作成者 affaan-m

documentation-lookup は、記憶に頼らず最新の docs をもとに、ライブラリ、フレームワーク、API に関する質問へ答えるのを助ける skill です。セットアップ、設定、リファレンス、コード例のタスク、とくに最新の構文が重要な場面に最適です。リクエストが live documentation とバージョン正確な案内に依存する場合は、Skill Docs 用の documentation-lookup skill を使ってください。

Skill Docs

お気に入り 0GitHub 156.1k

mcp-builder

作成者 anthropics

mcp-builder は、外部APIやサービス向けのMCPサーバーを企画・実装・評価するための実践ガイドです。ツールの範囲設計、命名、transport、Python / Node の実装パターン、評価フローの判断を助け、エージェントが安定して使えるサーバー設計に役立ちます。

MCP Server Development

お気に入り 0GitHub 105k

user-story

作成者 deanpeters

user-story スキルは、製品要件を、Mike Cohn 形式の記述と Gherkin の受け入れ基準を備えた、開発にそのまま使える 1 つのストーリーにまとめるのを支援します。より明確な引き継ぎ、精度の高い見積もり、Technical Writing やプロダクトチーム向けの、より実用的な user-story ガイド作成に役立ちます。

Technical Writing

お気に入り 0GitHub 4.1k

user-story-splitting

作成者 deanpeters

user-story-splitting スキルは、構造化されたパターンを使って、大きなエピックやユーザーストーリーを、より小さく独立して提供できるストーリーに分割するのに役立ちます。見積もり、順序付け、リスク低減、Skill Authoring のワークフローで、バックログ項目が1スプリントに収まらないほど広いときに活用してください。

Skill Authoring

お気に入り 0GitHub 0

sanity-best-practices

作成者 sanity-io

sanity-best-practices は、実装前に適切な Sanity の設計パターンを見極めるための skill です。schemas、GROQ、TypeGen、Visual Editing、Portable Text、localization、migrations、Functions、Blueprints、そして Next.js、Nuxt、Astro、Remix、SvelteKit、Angular、Hydrogen、App SDK などのフロントエンド連携に使えます。

Frontend Development

お気に入り 0GitHub 0

provider-docs

作成者 hashicorp

provider-docs スキルは、Terraform Provider 向けの Terraform Registry ドキュメントを作成・更新・検証するのに役立ちます。provider-docs のガイド作業、Technical Writing 向けの provider-docs、ドキュメント変更時に schema descriptions、tfplugindocs テンプレート、Registry 出力を同期させる用途に使えます。

Technical Writing

お気に入り 0GitHub 0

press-release

作成者 deanpeters

press-release スキルは、実装前に Amazon 形式の Working Backwards プレスリリースを下書きするのに役立ちます。顧客価値を整理し、製品や機能のアイデアを検証し、簡潔で顧客中心のストーリーで関係者の認識をそろえるために使えます。Technical Writing の press-release や初期段階のプロダクト企画に特に有用です。

Technical Writing

お気に入り 0GitHub 4.1k

writing-skills

作成者 obra

writing-skills は、エージェントスキルの作成・編集・検証をテスト駆動のワークフローで進めるための Skill Authoring ガイドです。主要ファイル、前提条件、プレッシャーシナリオ、ベースラインテスト、簡潔な SKILL.md を反復改善する実践手順を把握できます。

Skill Authoring

お気に入り 0GitHub 121.9k

prd-generator

作成者 ognjengt

prd-generator は、ざっくりしたプロダクトアイデアを AI で使える Product Requirements Document（PRD）に変換します。確認質問を投げ、決まったテンプレートに沿って整理し、創業者、プロダクト責任者、Skill Authoring のワークフローで、下流の AI コーディングツール向けにより明確な仕様を作るのを支援します。構造化された要件、指標、制約、実装にそのまま使える文脈が必要なときに使う skill です。

Skill Authoring

お気に入り 0GitHub 0

command-creator

作成者 softaworks

command-creatorは、Claude Codeで繰り返し使う作業フローを再利用できるslash commandsへ整理したいときに役立つスキルです。適切なコマンド設計の考え方、エージェントがそのまま実行しやすい指示の書き方、`.claude/commands/` と `~/.claude/commands/` の使い分け、さらに実例とベストプラクティスをまとめた同梱リファレンスまで確認できます。

Skill Authoring

お気に入り 0GitHub 1.3k

altitude-horizon-framework

作成者 deanpeters

altitude-horizon-framework は、PM から Director への移行を支援する意思決定スキルです。Altitude と Horizon のギャップを診断し、スコープとタイミングを整理し、戦略が曖昧なときは Cascading Context Map を適用できます。スキル作成向けに、実践的なインストール、使い方、例示ガイドも含まれています。

Skill Authoring

お気に入り 0GitHub 4.1k

prompt-optimizer

作成者 affaan-m

prompt-optimizer は、ラフなプロンプトを分析して不足している文脈を洗い出し、より明確でそのまま貼り付けられる形に書き直す prompt-optimizer スキルです。prompt-optimizer のガイド作成、プロンプトレビュー、Prompt Writing における prompt-optimizer に最適で、特に Claude Code や ECC ワークフローでよりよい構成が必要な場合に役立ちます。基盤となるタスクの実行は行いません。

Prompt Writing

お気に入り 0GitHub 156.2k

continuous-learning-v2

作成者 affaan-m

continuous-learning-v2 は、Claude Code のセッションを hooks、observer agents、confidence scoring、そして繰り返しパターンを skills・commands・agents に昇格させる仕組みによって、プロジェクト単位の学習へ変えるスキルです。

Skill Authoring

お気に入り 0GitHub 156.1k

documentation-and-adrs

作成者 addyosmani

documentation-and-adrs は、エージェントが意思決定を軸にした技術ドキュメントやADRを作成するのを助けます。アーキテクチャ、API、インフラ、認証、機能変更について、背景、制約、トレードオフ、却下した案、影響を整理して残すのに向いています。未来のエンジニアやエージェントのために、見栄えのよい要約ではなく、長く使える判断根拠が必要な場面に最適です。

Technical Writing

お気に入り 0GitHub 18.7k