dummy-dataset

作者 phuryn

dummy-dataset 可產生接近真實的測試資料，輸出格式包含 CSV、JSON、SQL 或 Python script。它可用於 mock dataset、demo、資料庫種子資料、QA 與資料清理；你可以定義欄位、列數與限制條件，生成更像真的範例紀錄。

Stars11.1k

評論0

加入時間2026年5月12日

分類数据清洗

安裝指令

npx skills add phuryn/pm-skills --skill dummy-dataset

編輯評分

這個技能的評分是 68/100，代表可以列出，但建議搭配保留說明一起呈現。對目錄使用者來說，它有清楚的用途、可直接使用的參數，以及一步一步的生成流程，讓 agent 比起面對一般提示詞時更容易啟動。不過，目前看起來只有單一 `SKILL.md`，沒有支援腳本或參考資料，因此採用信心屬於中等，還不到很強。

68/100

亮點

觸發條件與使用情境清楚：可用來產生逼真的 dummy dataset，支援測試、demo 與開發用途。
操作結構明確，參數名稱涵蓋 product、dataset type、rows、columns、format 與 constraints。
提供步驟化流程與輸出格式（CSV、JSON、SQL、Python script），讓 agent 有明確的執行路徑。

注意事項

從 repository 證據來看，沒有支援腳本、參考資料或其他資源，因此可信度與深度都只限於提示詞本身。
帶有實驗性／測試性訊號，表示它較適合 sample-data 任務，而不是 production-grade 的資料生成流程。

数据集 CSV JSON Sql Python

總覽

dummy-dataset 技能概覽

dummy-dataset 能做什麼

dummy-dataset 技能可以快速產生逼真的測試資料：CSV、JSON、SQL，或是之後可重複產生資料的 Python 腳本。它最適合需要看起來可信的樣本資料的人，用在 QA、展示 demo、seed data，或原型資料管線，而不只是隨便塞些空白內容。dummy-dataset 技能真正的價值，在於你可以描述領域、欄位、列數與限制條件，讓輸出變成可用資料，而不是一看就知道是合成的假資料。

什麼情況最適合用這個技能

在需要跨欄位保持一致性的資料情境下，例如 Data Cleaning、產品測試、分析 mockup、表單驗證與資料庫 seeding，dummy-dataset 都很適合。當你在意日期、分類、ID 或合理數值範圍之間的關聯時，這個技能特別有用。如果你只需要一次性的玩具範例，或你的工作已經有來自 production 的真實 schema，那它就沒那麼有幫助。

這個技能和一般做法有什麼不同

和一般提示詞不同，dummy-dataset 技能一開始就把輸出格式與限制條件放在核心位置。當你需要的是能直接匯入或執行的資料，而不只是看起來像資料的內容時，這點差很多。最重要的判斷點在於：你要的是可直接使用的檔案，還是可重現的產生腳本；這個技能兩者都支援。

如何使用 dummy-dataset 技能

安裝 dummy-dataset

在你的 skills 環境中用以下指令安裝 dummy-dataset 技能：

npx skills add phuryn/pm-skills --skill dummy-dataset

安裝完成後，先打開技能檔案，了解預期輸入與輸出風格，再把它放進更大的工作流程中使用。

先讀對的檔案

先讀 SKILL.md，再視環境查看 README.md、AGENTS.md、metadata.json，以及任何存在的 rules/、resources/、references/ 或 scripts/ 資料夾。就這個 repo 而言，SKILL.md 是主要依據，因為這個技能內容精簡，不太依賴輔助檔案。如果你要把 dummy-dataset 用在正式工作流，先讀生成範本與範例段落，再要求最終輸出。

下達技能能直接執行的提示

好的 dummy-dataset 使用需求，應該包含資料集用途、欄位、列數、格式與限制條件。例如：Generate a 500-row dummy-dataset for a SaaS billing app with columns for customer_id, plan, signup_date, churned, and MRR in CSV format; keep IDs unique, dates within the last 18 months, and churned consistent with subscription status. 這會比單純說「做一些 sample data」好得多，因為它提供足夠結構，讓技能能維持資料集的合理性。

提升輸出品質的最佳流程

建議分兩段使用這個技能：先定義資料集規格，再檢查欄位與限制條件是否合理，然後根據結果微調。如果你要把 dummy-dataset 用在 Data Cleaning，請刻意要求邊界案例，例如缺漏值、重複值、格式錯誤的 email，或日期格式不一致。如果你需要的是腳本，請一開始就說明語言與執行環境，讓輸出能和你的工具鏈對上。

dummy-dataset 技能常見問題

dummy-dataset 適合產生接近 production 的測試資料嗎？

可以，如果你需要的是結構受控、看起來可信的 mock 記錄。當下游工具依賴欄位一致性時，dummy-dataset 很有用；但它仍然是合成資料，不能當作真實使用者資料，也不應被視為你業務的統計模型。

使用它需要程式能力嗎？

不需要。初學者只要用自然語言描述資料集，並指定想要的格式，就可以使用 dummy-dataset。更精準的輸入通常會帶來更好的結果，但除非你想輸出 Python 腳本或 SQL insert，否則不必自己寫程式。

什麼情況不該用這個技能？

當你需要真實資料的匿名化、符合法規的合成資料生成，或是 production schema 的完整複製且含有敏感限制時，不要用 dummy-dataset。這類需求通常更適合專門的資料管線，或具隱私保護能力的工具，而不是以提示詞驅動的 dummy-dataset 指南。

它比一般提示詞更好嗎？

通常是，因為 dummy-dataset 技能會逼你把欄位、商業規則與輸出格式一起定義。一般提示詞常常少掉其中一項，結果資料看起來表面上還行，實際上卻會在匯入、測試或驗證時出問題。

如何改進 dummy-dataset 技能

提供更精準的資料集規格

最大的品質提升，來自把領域描述成欄位與規則，而不只是主題。與其說「生成客戶資料」，不如要求像 customer_id、segment、signup_date、lifetime_value、status 這類具體欄位，外加像「lifetime_value 要依 segment 有差異」或「signup_date 不能是未來日期」這類規則。這會讓 dummy-dataset 技能可靠得多。

把下游真正需要的限制條件補齊

如果你後續要清理、驗證或匯入資料，就要明確說出生成後必須滿足什麼條件。請提到唯一性、null 比例、日期範圍、允許的 enum、類 foreign-key 關聯，以及格式要求。如果是用在 Data Cleaning 的 dummy-dataset，請刻意要求受控錯誤，讓資料真的能測到你的清理邏輯。

針對缺陷迭代，不要只針對偏好

拿到第一版輸出後，修改重點應該放在那些真的影響工作流程的問題：欄位名稱不對、範圍不合理、缺少邊界案例，或格式不好載入。接著只要求一兩個明確修正點的 dummy-dataset 版本，不要把整個需求重新複述一遍。這樣輸出會更實用，也能避免過度迎合表面細節。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

lamindb

作者 K-Dense-AI

lamindb 技能可協助你使用 LaminDB——一個開源的生物資料框架，讓資料具備可查詢、可追蹤、可重現與 FAIR 特性。適合用於 lamindb 的資料分析、metadata 整理、基於 ontology 的標註、schema 驗證，以及跨 notebooks 與 pipelines 的 lineage-aware 工作流程。

数据分析

收藏 0GitHub 0

exploratory-data-analysis

作者 K-Dense-AI

exploratory-data-analysis 技能可將科學檔案轉為支援格式感知的 EDA 報告。它會偵測檔案類型、摘要結構與品質、擷取關鍵中繼資料，並建議後續分析方向。適合用於 Data Analysis 中的 exploratory-data-analysis，涵蓋化學、生物資訊、顯微影像、光譜、蛋白質體、代謝體與其他科學檔案格式。

数据分析

收藏 0GitHub 0

read-file

作者 duckdb

read-file 可協助代理讀取與檢視 CSV、JSON、Parquet、Avro、Excel、SQLite、空間檔案，或透過 DuckDB 存取遠端 URL。可用來預覽資料列、檢查 schema、分析資料，並回答這個檔案裡有什麼。它最適合用在實際資料檔案上的 read-file 使用情境，不適合原始程式碼。

辦公文件

收藏 0GitHub 443

data-quality-frameworks

作者 wshobson

data-quality-frameworks 技能可協助團隊規劃正式環境的資料驗證，涵蓋 dbt tests、Great Expectations 與 data contracts。可用來選擇合適的檢查項目、對應到 testing pyramid，並規劃適合 Data Cleaning 與資料管線穩定性的 CI/CD 資料品質工作流程。

数据清洗

收藏 0GitHub 32.6k

data-analyst

作者 Shubhamsaboo

data-analyst 是一個精簡的 GitHub skill，會引導代理以 SQL、pandas 與基礎統計分析來進行資料探索。適合希望透過單一 SKILL.md 提示層，就能完成具程式碼支撐的查詢、轉換與結果解讀的使用者。

数据分析

收藏 0GitHub 104.2k

frontend-design

作者 anthropics

frontend-design 協助你把模糊的 UI 構想變成具有明確美感方向的獨特、可上線前端介面，產出真實可用的 frontend 程式碼，減少千篇一律的 AI 風格。

UI 設計

收藏 1GitHub 105.2k

create-colleague

作者 titanwings

create-colleague 可將同事文件、聊天紀錄、電子郵件、截圖、Feishu 與 DingTalk 資料整理成可編輯的 AI 技能，並分別產出工作與人物設定內容，也提供後續持續優化的更新流程。

Skill 編寫

收藏 1GitHub 747

hyperframes

作者 heygen-com

hyperframes 是一個工作流程技能，用於在 HyperFrames 中建立以 HTML 為基礎的影片組成內容。當你需要結構化、以程式碼為核心的 hyperframes 來處理影片剪輯時，可用於標題卡、疊加圖層、字幕、旁白、音訊反應動態，以及場景轉場。它更重視版面配置、時間安排與動畫決策，而不是泛用的、只靠提示詞的影片需求。

视频编辑

收藏 0GitHub 2.7k

kreuzberg

作者 kreuzberg-dev

這個 kreuzberg 技能可協助你安裝並使用 Kreuzberg 進行文件擷取，支援 91 種以上格式，包括 PDF、Office 檔案、圖片、HTML、電子郵件與壓縮檔。內容涵蓋 Python、Node.js/TypeScript、Rust 與 CLI 工作流程，適用於 OCR、表格、中繼資料、批次處理，以及實務解析指引。

PDF 处理

收藏 0GitHub 0

skill-creator

作者 anthropics

skill-creator 是一個用於撰寫技能的 meta-skill，可協助起草新技能、修改既有 `SKILL.md`、執行 eval、比較不同版本，並透過 repository 腳本與審查工具優化觸發描述。

Skill 編寫

收藏 2GitHub 105.1k

azure-identity-py

作者 microsoft

azure-identity-py 可協助你在 Python 中使用 Microsoft Entra ID 設定 Azure 驗證。可用來選擇 DefaultAzureCredential、managed identity 或 service principal 驗證，設定環境變數，並排除存取控制與 credential chain 問題。安裝指引、使用模式與實用設定說明皆根據 repo skill file 整理而成。

存取控制

收藏 0GitHub 2.2k

claude-api

作者 anthropics

claude-api 是一個實用技能，協助安裝並使用 Claude API 與 Anthropic SDK。它可幫助開發者在 SDK 與原生 HTTP 方案間做選擇、辨識對應語言文件，並以較少摸索完成串流、工具使用、檔案、批次與錯誤處理。

API 开发

收藏 0GitHub 105k

wrangler

作者 cloudflare

wrangler 技能可協助你找到 Cloudflare Workers 正確的 CLI 指令、設定結構與部署步驟。適合用在 wrangler 的使用方式、wrangler 安裝檢查，以及在為 Backend Development 建置或交付 Workers 時，取得實用的 wrangler 指南。

後端开发

收藏 0GitHub 1.3k

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

clickhouse-architecture-advisor

作者 ClickHouse

clickhouse-architecture-advisor 協助設計 ClickHouse 工作負載，針對資料攝取、分區、JOIN、字典、upsert 與預先聚合做出符合工作負載的決策。它特別適合後端開發、可觀測性、SIEM、產品分析、IoT 遙測，以及金融資料管線。此技能會將建議標示為 official、derived 或 field。

後端开发

收藏 0GitHub 412

figma-generate-library

作者 figma

figma-generate-library 可協助你從程式碼庫建立或更新 Figma 設計系統，並以有順序的工作流程處理 tokens、元件庫、文件與明暗主題切換。當你需要的是 Design Systems 的實作指南，而不是一次性的 mockup 時，就適合使用 figma-generate-library 技能。它也會與 figma-use 互補，用於 Plugin API 呼叫。

設計系统

收藏 0GitHub 0