dummy-dataset

作成者 phuryn

dummy-dataset は、CSV、JSON、SQL、または Python スクリプト形式で、実在感のあるテストデータを生成します。列名、行数、制約を指定して、モックデータセット、デモ、データベースのシーディング、QA、データクレンジングに使える、信頼感のあるサンプルレコードを作成できます。

スター11.1k

お気に入り0

追加日2026年5月12日

カテゴリーData Cleaning

インストールコマンド

npx skills add phuryn/pm-skills --skill dummy-dataset

編集スコア

このスキルのスコアは 68/100 で、掲載は可能ですが注意書き付きで紹介するのが適切です。目的が明確で、使える引数と段階的な生成フローがあり、一般的なプロンプトよりもエージェントが迷わず呼び出しやすい構成です。一方で、確認できるのは単一の `SKILL.md` のみで、補助スクリプトや参考資料がないため、導入の確信度は高いというより中程度です。

68/100

強み

トリガーと用途が明確で、テスト、デモ、開発向けにリアルなダミーデータセットを生成する用途に合っています。
product、dataset type、rows、columns、format、constraints などの引数が整理されており、運用の流れが分かりやすいです。
段階的なワークフローと出力形式（CSV、JSON、SQL、Python script）により、エージェントが実行手順を具体的に組み立てやすいです。

注意点

リポジトリ上の証拠では、補助スクリプト、参考資料、関連リソースが確認できないため、信頼性や深さはプロンプト本文に依存します。
実験的・テスト向けの संकेतがあるため、本番レベルのデータ生成ワークフローよりも、サンプルデータ用途に向いています。

Dataset CSV Json Sql Python

概要

dummy-dataset skill の概要

dummy-dataset でできること

dummy-dataset skill は、CSV、JSON、SQL、または後でデータを生成できる Python スクリプトとして、リアルなテストデータを素早く作るのに役立ちます。QA、デモ、seed data、プロトタイプのパイプライン向けに、単なるランダムなダミーではなく、もっともらしいサンプルレコードが必要な人に向いています。dummy-dataset skill の本質的な価値は、ドメイン、列、行数、制約を指定できるため、見た目だけの synthetic data ではなく、実際に使える出力にしやすい点にあります。

この skill が向いているケース

dummy-dataset は、Data Cleaning、プロダクトテスト、分析用モック、フォーム検証、database seeding など、列をまたいで整合性のあるデータが必要な場面に向いています。日付、カテゴリ、ID、現実的な範囲といった関係性を重視するなら、特に相性が良いです。一方で、単発の簡単な例だけが欲しい場合や、本番由来の実スキーマがすでに手元にある作業には、それほど向きません。

何が違うのか

一般的なプロンプトと違い、dummy-dataset skill は最初から出力形式と制約を意識して作られています。これは、単に読むだけでなく、実際に import したり実行したりできるデータが必要なときに重要です。主な判断ポイントは、すぐ使えるファイルが欲しいのか、再現可能な生成スクリプトが欲しいのかという点で、この skill はその両方に対応します。

dummy-dataset skill の使い方

dummy-dataset をインストールする

次のコマンドで、skills 環境に dummy-dataset skill をインストールします。

npx skills add phuryn/pm-skills --skill dummy-dataset

インストール後は、まず skill ファイルを開いて、期待される入力と出力の形式を確認してから、大きなワークフローの中でプロンプトを投げるようにしてください。

まず読むべきファイル

最初に SKILL.md を読み、次に README.md、AGENTS.md、metadata.json、そして環境に存在するなら rules/、resources/、references/、scripts/ フォルダも確認してください。この repository では、skill がコンパクトで補助ファイルに依存していないため、SKILL.md が主な正本です。dummy-dataset を実務フローで使うなら、最終出力を依頼する前に生成テンプレートと例のセクションを読んでおくとよいです。

skill が実行できる形で依頼する

良い dummy-dataset の依頼には、データセットの目的、項目、行数、形式、制約を含めるべきです。たとえば、「SaaS billing app 用に 500 行の dummy-dataset を CSV 形式で作成してください。列は customer_id、plan、signup_date、churned、MRR。ID は一意、日付は過去 18 か月以内、churned は subscription status と整合させてください。」のように書きます。これは「サンプルデータを作って」よりずっと優れていて、skill がもっともらしいデータセットを保てるだけの構造を与えられます。

出力品質を上げるための最適な進め方

skill は 2 回に分けて使うと効果的です。まずデータセット仕様を定義し、その後、列と制約が現実的かを確認してから出力を詰めます。dummy-dataset を Data Cleaning に使うなら、欠損値、重複、不正なメールアドレス、日付形式の不一致など、意図的な edge case を頼んでください。スクリプトが必要なら、言語と実行環境を最初に指定すると、ツールに合った出力になります。

dummy-dataset skill の FAQ

dummy-dataset は本番に近いテストデータに向いていますか？

はい。構造を管理しつつ、もっともらしいモックレコードが必要な場合には向いています。dummy-dataset skill は、下流ツールが項目間の整合性を前提にしているときに有効ですが、あくまで synthetic data なので、実ユーザーのデータやビジネスの統計モデルとして扱うべきではありません。

使うのにプログラミング知識は必要ですか？

いいえ。初心者でも、データセットの内容を自然文で説明し、欲しい形式を指定するだけで dummy-dataset を使えます。より正確な入力ほど結果は良くなりますが、Python スクリプトや SQL の insert 出力を望まない限り、コードを書く必要はありません。

どんなときにこの skill を使うべきではありませんか？

実データの匿名化、法令対応が必要な synthetic data 生成、あるいは機密制約を含む本番スキーマの完全なコピーが必要な場合は、dummy-dataset を使わないでください。その場合は、プロンプト主導の dummy-dataset ガイドよりも、専用の data pipeline や privacy-aware なツールの方が適していることがあります。

通常のプロンプトより優れていますか？

多くの場合ははい。dummy-dataset skill は、列、業務ルール、出力形式をまとめて定義するよう促してくれるからです。通常のプロンプトではこのどれかが抜けやすく、見た目は悪くなくても、import、テスト、検証の段階で失敗するデータになりがちです。

dummy-dataset skill を改善するには

データセット仕様をもっと具体的にする

品質を最も大きく左右するのは、テーマだけでなく、項目とルールでドメインを指定することです。「顧客データを生成して」ではなく、customer_id、segment、signup_date、lifetime_value、status のような具体的な列と、「lifetime_value は segment によって変動すること」「signup_date は未来日にならないこと」といったルールを指定してください。これで dummy-dataset skill の信頼性がかなり上がります。

後工程で重要な制約を足す

データを clean、validate、import する予定があるなら、生成後に何が成立していなければならないかを明示してください。一意性、null の割合、日付範囲、許可する enum、foreign-key 風の関係、形式要件などを伝えます。Data Cleaning 用の dummy-dataset なら、クリーニング処理を実際に試せるよう、制御されたエラーをあえて入れるよう依頼してください。

好みではなく、不具合を起点に改善する

最初の出力を見たら、修正依頼は好みではなく、ワークフローを壊した点に絞ります。たとえば、列名が悪い、範囲が現実離れしている、edge case が足りない、読み込みにくい形式になっている、といった点です。そのうえで、要求全体を言い直すのではなく、1〜2 点だけ具体的に直した dummy-dataset 版を頼んでください。そうすると実務的な出力を保ちやすく、見た目の細部に過剰適合するのを防げます。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

read-file

作成者 duckdb

read-file は、DuckDB を使って CSV、JSON、Parquet、Avro、Excel、SQLite、空間データファイル、またはリモート URL を読み取り・確認するための skill です。行のプレビュー、スキーマ確認、データのプロファイリング、そして「このファイルに何が入っているか」の把握に使えます。ソースコードではなく、実データ資産に対する read-file の用途に最適です。

Office Documents

お気に入り 0GitHub 443

data-quality-frameworks

作成者 wshobson

data-quality-frameworks は、dbt tests、Great Expectations、data contracts を使って本番データの検証計画を立てたいチーム向けのスキルです。適切なチェックの選定、テストピラミッドへの整理、そして Data Cleaning やパイプライン信頼性を支える CI/CD 対応のデータ品質ワークフロー設計に役立ちます。

Data Cleaning

お気に入り 0GitHub 32.6k

data-analyst

作成者 Shubhamsaboo

data-analyst は、データ探索のために SQL、pandas、基礎的な統計分析へエージェントを導く、最小構成の GitHub スキルです。単一の SKILL.md プロンプト層で、コードに基づくクエリ、変換、解釈までまとめて引き出したいユーザーに向いています。

Data Analysis

お気に入り 0GitHub 104.2k

frontend-design

作成者 anthropics

frontend-designは、曖昧なUIアイデアから、汎用的でないスタイリングと明確な美的指針を備えた、個性的なプロダクション品質のフロントエンド実装を生成するのに役立つスキルです。

UI Design

お気に入り 1GitHub 105.2k

create-colleague

作成者 titanwings

create-colleague は、同僚に関するドキュメント、チャット、メール、スクリーンショット、Feishu、DingTalk のデータをもとに、編集可能な AI スキルを生成します。業務面と人物像を分けて出力でき、継続的に磨き込むための更新フローにも対応しています。

Skill Authoring

お気に入り 1GitHub 747

hyperframes

作成者 heygen-com

hyperframes は、HyperFrames で HTML ベースの動画コンポジションを構築するためのワークフロースキルです。タイトルカード、オーバーレイ、字幕、ナレーション、音に反応するモーション、シーン遷移など、Video Editing 向けに構造化されたコードファーストの hyperframes が必要なときに使えます。汎用的なプロンプトだけの動画依頼よりも、レイアウト、タイミング、アニメーションの設計を重視します。

Video Editing

お気に入り 0GitHub 2.7k

kreuzberg

作成者 kreuzberg-dev

このkreuzbergスキルは、PDF、Officeファイル、画像、HTML、メール、アーカイブなど91種類以上の形式に対応するKreuzbergの導入と活用を支援します。OCR、表、メタデータ、バッチ処理、実用的な解析の進め方まで、Python、Node.js/TypeScript、Rust、CLI の各ワークフローをカバーします。

PDF Processing

お気に入り 0GitHub 0

skill-creator

作成者 anthropics

skill-creator は、新規スキル作成、既存の SKILL.md 改訂、eval 実行、バリアント比較、トリガー説明の改善を支援する Skill Authoring 向けメタスキルです。リポジトリ内のスクリプトやレビュー補助を使った実務的な運用に向いています。

Skill Authoring

お気に入り 2GitHub 105.1k

azure-identity-py

作成者 microsoft

azure-identity-py は、Microsoft Entra ID を使った Python の Azure 認証設定を支援します。DefaultAzureCredential、マネージド ID、サービスプリンシパル認証の選択、環境変数の設定、アクセス制御や資格情報チェーンの問題のトラブルシュートに活用できます。インストール手順、利用パターン、実践的な設定メモは、repo の skill file に基づいています。

Access Control

お気に入り 0GitHub 2.2k

claude-api

作成者 anthropics

claude-apiは、Claude APIとAnthropic SDKの導入・実装を進めやすくする実用的なスキルです。SDKを使うかraw HTTPを選ぶかの判断、言語別ドキュメントの見極め、streaming、tool use、files、batches、error handlingの実装を、手探りを減らして進められます。

API Development

お気に入り 0GitHub 105k

wrangler

作成者 cloudflare

wranglerスキルは、Cloudflare Workersで正しいCLIコマンド、設定形式、デプロイ手順を見つけるのに役立ちます。wranglerの使い方、wranglerの導入確認、Backend DevelopmentでWorkersを作成・公開する際の実用的なwranglerガイドとして活用してください。

Backend Development

お気に入り 0GitHub 1.3k

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

clickhouse-architecture-advisor

作成者 ClickHouse

clickhouse-architecture-advisor は、ワークロードを踏まえた判断で ClickHouse の設計を支援します。取り込み、パーティション設計、JOIN、辞書、UPSERT、事前集計まで、負荷特性に合わせて選べるのが強みです。Backend Development、可観測性、SIEM、プロダクト分析、IoT テレメトリ、金融系パイプラインで特に役立ちます。ガイダンスは `official`、`derived`、`field` として分類されます。

Backend Development

お気に入り 0GitHub 412

figma-generate-library

作成者 figma

figma-generate-library は、コードベースから Figma のデザインシステムを構築・更新するためのスキルです。トークン、コンポーネントライブラリ、ドキュメント、ライト/ダークテーマ対応まで、順序立てたワークフローで進められます。単発のモックアップではなく、Design Systems 向けの実践的なガイドが必要なときに使ってください。Plugin API の呼び出しには figma-use を補完的に併用できます。

Design Systems

お気に入り 0GitHub 0

winui-app

作成者 openai

winui-appスキルは、C# と Windows App SDK を使った WinUI 3 デスクトップアプリの立ち上げ、開発、トラブルシューティングを支援します。環境の準備、新規アプリのセットアップ、シェルとナビゲーションの選定、XAML コントロール、テーマ、アクセシビリティ、デプロイ、起動不具合の修正フローなど、Frontend Development に役立てられます。

Frontend Development

お気に入り 0GitHub 0

speech

作成者 openai

speech skillを使うと、テキストを音声に変換して、ナレーション、ボイスオーバー、IVRプロンプト、アクセシビリティ向け読み上げ、バッチ音声生成に活用できます。OpenAI Audio API、組み込み音声、同梱のCLI、そしてライブ実行用の`OPENAI_API_KEY`を使用します。カスタム音声の作成は対象外です。

Design Implementation

お気に入り 0GitHub 0