P

dummy-dataset

作成者 phuryn

dummy-dataset は、CSV、JSON、SQL、または Python スクリプト形式で、実在感のあるテストデータを生成します。列名、行数、制約を指定して、モックデータセット、デモ、データベースのシーディング、QA、データクレンジングに使える、信頼感のあるサンプルレコードを作成できます。

スター11.1k
お気に入り0
コメント0
追加日2026年5月12日
カテゴリーData Cleaning
インストールコマンド
npx skills add phuryn/pm-skills --skill dummy-dataset
編集スコア

このスキルのスコアは 68/100 で、掲載は可能ですが注意書き付きで紹介するのが適切です。目的が明確で、使える引数と段階的な生成フローがあり、一般的なプロンプトよりもエージェントが迷わず呼び出しやすい構成です。一方で、確認できるのは単一の `SKILL.md` のみで、補助スクリプトや参考資料がないため、導入の確信度は高いというより中程度です。

68/100
強み
  • トリガーと用途が明確で、テスト、デモ、開発向けにリアルなダミーデータセットを生成する用途に合っています。
  • product、dataset type、rows、columns、format、constraints などの引数が整理されており、運用の流れが分かりやすいです。
  • 段階的なワークフローと出力形式(CSV、JSON、SQL、Python script)により、エージェントが実行手順を具体的に組み立てやすいです。
注意点
  • リポジトリ上の証拠では、補助スクリプト、参考資料、関連リソースが確認できないため、信頼性や深さはプロンプト本文に依存します。
  • 実験的・テスト向けの संकेतがあるため、本番レベルのデータ生成ワークフローよりも、サンプルデータ用途に向いています。
概要

dummy-dataset skill の概要

dummy-dataset でできること

dummy-dataset skill は、CSV、JSON、SQL、または後でデータを生成できる Python スクリプトとして、リアルなテストデータを素早く作るのに役立ちます。QA、デモ、seed data、プロトタイプのパイプライン向けに、単なるランダムなダミーではなく、もっともらしいサンプルレコードが必要な人に向いています。dummy-dataset skill の本質的な価値は、ドメイン、列、行数、制約を指定できるため、見た目だけの synthetic data ではなく、実際に使える出力にしやすい点にあります。

この skill が向いているケース

dummy-dataset は、Data Cleaning、プロダクトテスト、分析用モック、フォーム検証、database seeding など、列をまたいで整合性のあるデータが必要な場面に向いています。日付、カテゴリ、ID、現実的な範囲といった関係性を重視するなら、特に相性が良いです。一方で、単発の簡単な例だけが欲しい場合や、本番由来の実スキーマがすでに手元にある作業には、それほど向きません。

何が違うのか

一般的なプロンプトと違い、dummy-dataset skill は最初から出力形式と制約を意識して作られています。これは、単に読むだけでなく、実際に import したり実行したりできるデータが必要なときに重要です。主な判断ポイントは、すぐ使えるファイルが欲しいのか、再現可能な生成スクリプトが欲しいのかという点で、この skill はその両方に対応します。

dummy-dataset skill の使い方

dummy-dataset をインストールする

次のコマンドで、skills 環境に dummy-dataset skill をインストールします。

npx skills add phuryn/pm-skills --skill dummy-dataset

インストール後は、まず skill ファイルを開いて、期待される入力と出力の形式を確認してから、大きなワークフローの中でプロンプトを投げるようにしてください。

まず読むべきファイル

最初に SKILL.md を読み、次に README.mdAGENTS.mdmetadata.json、そして環境に存在するなら rules/resources/references/scripts/ フォルダも確認してください。この repository では、skill がコンパクトで補助ファイルに依存していないため、SKILL.md が主な正本です。dummy-dataset を実務フローで使うなら、最終出力を依頼する前に生成テンプレートと例のセクションを読んでおくとよいです。

skill が実行できる形で依頼する

良い dummy-dataset の依頼には、データセットの目的、項目、行数、形式、制約を含めるべきです。たとえば、「SaaS billing app 用に 500 行の dummy-dataset を CSV 形式で作成してください。列は customer_id、plan、signup_date、churned、MRR。ID は一意、日付は過去 18 か月以内、churned は subscription status と整合させてください。」のように書きます。これは「サンプルデータを作って」よりずっと優れていて、skill がもっともらしいデータセットを保てるだけの構造を与えられます。

出力品質を上げるための最適な進め方

skill は 2 回に分けて使うと効果的です。まずデータセット仕様を定義し、その後、列と制約が現実的かを確認してから出力を詰めます。dummy-dataset を Data Cleaning に使うなら、欠損値、重複、不正なメールアドレス、日付形式の不一致など、意図的な edge case を頼んでください。スクリプトが必要なら、言語と実行環境を最初に指定すると、ツールに合った出力になります。

dummy-dataset skill の FAQ

dummy-dataset は本番に近いテストデータに向いていますか?

はい。構造を管理しつつ、もっともらしいモックレコードが必要な場合には向いています。dummy-dataset skill は、下流ツールが項目間の整合性を前提にしているときに有効ですが、あくまで synthetic data なので、実ユーザーのデータやビジネスの統計モデルとして扱うべきではありません。

使うのにプログラミング知識は必要ですか?

いいえ。初心者でも、データセットの内容を自然文で説明し、欲しい形式を指定するだけで dummy-dataset を使えます。より正確な入力ほど結果は良くなりますが、Python スクリプトや SQL の insert 出力を望まない限り、コードを書く必要はありません。

どんなときにこの skill を使うべきではありませんか?

実データの匿名化、法令対応が必要な synthetic data 生成、あるいは機密制約を含む本番スキーマの完全なコピーが必要な場合は、dummy-dataset を使わないでください。その場合は、プロンプト主導の dummy-dataset ガイドよりも、専用の data pipeline や privacy-aware なツールの方が適していることがあります。

通常のプロンプトより優れていますか?

多くの場合ははい。dummy-dataset skill は、列、業務ルール、出力形式をまとめて定義するよう促してくれるからです。通常のプロンプトではこのどれかが抜けやすく、見た目は悪くなくても、import、テスト、検証の段階で失敗するデータになりがちです。

dummy-dataset skill を改善するには

データセット仕様をもっと具体的にする

品質を最も大きく左右するのは、テーマだけでなく、項目とルールでドメインを指定することです。「顧客データを生成して」ではなく、customer_idsegmentsignup_datelifetime_valuestatus のような具体的な列と、「lifetime_value は segment によって変動すること」「signup_date は未来日にならないこと」といったルールを指定してください。これで dummy-dataset skill の信頼性がかなり上がります。

後工程で重要な制約を足す

データを clean、validate、import する予定があるなら、生成後に何が成立していなければならないかを明示してください。一意性、null の割合、日付範囲、許可する enum、foreign-key 風の関係、形式要件などを伝えます。Data Cleaning 用の dummy-dataset なら、クリーニング処理を実際に試せるよう、制御されたエラーをあえて入れるよう依頼してください。

好みではなく、不具合を起点に改善する

最初の出力を見たら、修正依頼は好みではなく、ワークフローを壊した点に絞ります。たとえば、列名が悪い、範囲が現実離れしている、edge case が足りない、読み込みにくい形式になっている、といった点です。そのうえで、要求全体を言い直すのではなく、1〜2 点だけ具体的に直した dummy-dataset 版を頼んでください。そうすると実務的な出力を保ちやすく、見た目の細部に過剰適合するのを防げます。

評価とレビュー

まだ評価がありません
レビューを投稿
このスキルの評価やコメントを投稿するにはサインインしてください。
G
0/10000
新着レビュー
保存中...