dummy-dataset

von phuryn

dummy-dataset erzeugt realistische Testdaten als CSV, JSON, SQL oder Python-Skript. Es hilft bei Mock-Datasets, Demos, dem Befüllen von Datenbanken, QA und Datenbereinigung, indem Sie Spalten, Zeilenzahlen und Einschränkungen für glaubwürdige Beispieldaten definieren können.

Stars11.1k

Favoriten0

Kommentare0

Hinzugefügt12. Mai 2026

KategorieData Cleaning

Installationsbefehl

npx skills add phuryn/pm-skills --skill dummy-dataset

Kurationswert

Diese Skill erreicht 68/100 und ist damit grundsätzlich listenfähig, sollte aber mit Hinweisen eingeordnet werden. Nutzende des Verzeichnisses erhalten einen klar benannten Zweck, verwendbare Parameter und einen Schritt-für-Schritt-Workflow zur Generierung, sodass sich die Skill mit weniger Rätselraten auslösen lässt als mit einem generischen Prompt. Allerdings scheint sie auf eine einzelne SKILL.md ohne unterstützende Skripte oder Referenzen beschränkt zu sein, weshalb die Vertrauensbasis eher mittel als stark ist.

68/100

Stärken

Klarer Auslöser und Anwendungsfall: realistische Dummy-Datasets für Tests, Demos und Entwicklung erzeugen.
Die operative Struktur ist eindeutig, mit benannten Parametern für Produkt, Datensatztyp, Zeilen, Spalten, Format und Einschränkungen.
Der Schritt-für-Schritt-Workflow plus Ausgabeformate (CSV, JSON, SQL, Python-Skript) geben Agenten einen konkreten Ausführungspfad.

Hinweise

Die Repository-Evidenz zeigt keine unterstützenden Skripte, Referenzen oder Ressourcen, daher sind Vertrauen und Tiefe auf den Prompttext begrenzt.
Experimentelle bzw. testartige Signale deuten darauf hin, dass sich die Skill eher für Beispieldaten eignet als für produktionsreife Daten-Workflows.

Dataset CSV Json Sql Python

Überblick

Überblick über den dummy-dataset-Skill

Was dummy-dataset macht

Der dummy-dataset-Skill hilft Ihnen, schnell realistische Testdaten zu erzeugen: CSV, JSON, SQL oder ein Python-Skript, das die Daten später erzeugen kann. Er eignet sich besonders für alle, die glaubwürdige Beispieldatensätze für QA, Demos, Seed-Daten oder einen Prototyp-Workflow brauchen – nicht nur zufälliges Füllmaterial. Der eigentliche Mehrwert des dummy-dataset-Skills liegt darin, dass Sie Domäne, Spalten, Zeilenanzahl und Constraints beschreiben können, sodass die Ausgabe nutzbar ist statt offensichtlich synthetisch.

Wann dieser Skill die richtige Wahl ist

Verwenden Sie dummy-dataset für Data Cleaning, Produkttests, Analytics-Mockups, Formularvalidierung und das Befüllen von Datenbanken, wenn Sie Daten benötigen, die über mehrere Felder hinweg stimmig wirken. Der Skill ist besonders stark, wenn Beziehungen wie Datumswerte, Kategorien, IDs oder realistische Wertebereiche wichtig sind. Weniger hilfreich ist er, wenn Sie nur einmalige Spielbeispiele brauchen oder wenn Ihre Aufgabe bereits auf einem echten Schema aus der Produktion aufbaut.

Was ihn unterscheidet

Anders als ein generischer Prompt ist der dummy-dataset-Skill von Anfang an auf Ausgabeformat und Constraints ausgerichtet. Das ist entscheidend, wenn Sie Daten brauchen, die Sie tatsächlich importieren oder ausführen können, statt sie nur anzusehen. Die zentrale Frage ist, ob Sie direkt nutzbare Dateien oder ein reproduzierbares Generierungsskript wollen; der Skill unterstützt beides.

So verwenden Sie den dummy-dataset-Skill

dummy-dataset installieren

Installieren Sie den dummy-dataset-Skill in Ihrer Skills-Umgebung mit:

npx skills add phuryn/pm-skills --skill dummy-dataset

Öffnen Sie nach der Installation zuerst die Skill-Datei, damit Sie die erwarteten Eingaben und Ausgabeformate verstehen, bevor Sie den Skill in einem größeren Workflow ansprechen.

Zuerst die richtigen Dateien lesen

Beginnen Sie mit SKILL.md und prüfen Sie dann README.md, AGENTS.md, metadata.json sowie vorhandene Ordner wie rules/, resources/, references/ oder scripts/. Für dieses Repository ist SKILL.md die wichtigste Quelle, weil der Skill kompakt ist und keine Support-Dateien benötigt. Wenn Sie dummy-dataset in einem echten Workflow einsetzen, lesen Sie vor der finalen Ausgabe die Abschnitte mit Generierungsvorlage und Beispielen.

Einen Prompt geben, den der Skill ausführen kann

Eine gute Anfrage für dummy-dataset sollte Zweck des Datensatzes, Felder, Zeilenanzahl, Format und Constraints enthalten. Zum Beispiel: „Erzeuge einen 500-zeiligen dummy-dataset für eine SaaS-Billing-App mit Spalten für customer_id, plan, signup_date, churned und MRR im CSV-Format; IDs eindeutig halten, Datumswerte auf die letzten 18 Monate begrenzen und churned konsistent zum Abonnementstatus machen.“ Das ist deutlich besser als „mach Beispieldaten“, weil der Skill dadurch genug Struktur bekommt, um den Datensatz plausibel zu halten.

Bester Workflow für gute Ausgabequalität

Nutzen Sie den Skill in zwei Durchläufen: Zuerst definieren Sie die Datensatz-Spezifikation, dann verfeinern Sie die Ausgabe, nachdem Sie geprüft haben, ob Felder und Constraints realistisch sind. Wenn Sie dummy-dataset für Data Cleaning brauchen, fordern Sie absichtlich Edge Cases an, etwa fehlende Werte, Duplikate, fehlerhafte E-Mails oder inkonsistente Datumsformate. Wenn Sie ein Skript benötigen, nennen Sie Sprache und Ausführungsumgebung von Anfang an, damit die Ausgabe zu Ihrem Tooling passt.

dummy-dataset-Skill-FAQ

Ist dummy-dataset gut für produktionsähnliche Testdaten?

Ja, wenn Sie glaubwürdige Mock-Datensätze mit kontrollierter Struktur brauchen. Der dummy-dataset-Skill ist nützlich, wenn nachgelagerte Tools auf konsistente Felder angewiesen sind, aber es bleiben synthetische Daten. Behandeln Sie sie daher nicht als echte Nutzerdaten und auch nicht als statistisches Modell Ihres Unternehmens.

Brauche ich Programmierkenntnisse, um ihn zu nutzen?

Nein. Einsteiger können dummy-dataset verwenden, indem sie den Datensatz in natürlicher Sprache beschreiben und das gewünschte Format angeben. Präzisere Angaben verbessern die Ergebnisse, aber Sie müssen keinen Code schreiben, außer Sie möchten ein Python-Skript oder SQL-Insert-Ausgabe.

Wann sollte ich diesen Skill nicht verwenden?

Verwenden Sie dummy-dataset nicht, wenn Sie echte Datensätze anonymisieren müssen, rechtlich konforme synthetische Daten erzeugen wollen oder eine exakte Kopie eines Produktionsschemas mit sensiblen Constraints brauchen. In solchen Fällen ist eine spezialisierte Datenpipeline oder ein privacy-aware Tool oft besser geeignet als ein promptgesteuerter dummy-dataset-Workflow.

Ist er besser als ein normaler Prompt?

Meistens ja, weil der dummy-dataset-Skill Sie dazu bringt, Spalten, Geschäftsregeln und Ausgabeformat gemeinsam festzulegen. Ein normaler Prompt lässt oft einen dieser Punkte aus, wodurch Daten entstehen, die auf den ersten Blick okay wirken, beim Import, Testen oder Validieren aber scheitern.

dummy-dataset verbessern

Eine präzisere Datensatzspezifikation liefern

Der größte Qualitätssprung entsteht, wenn Sie die Domäne über Felder und Regeln beschreiben, nicht nur über ein Thema. Statt „generate customer data“ zu sagen, fragen Sie nach konkreten Feldern wie customer_id, segment, signup_date, lifetime_value und status plus Regeln wie „lifetime_value sollte je nach Segment variieren“ oder „signup_date darf nicht in der Zukunft liegen“. Dadurch wird der dummy-dataset-Skill deutlich zuverlässiger.

Die Constraints ergänzen, die downstream wirklich zählen

Wenn Sie die Daten später bereinigen, validieren oder importieren wollen, sagen Sie klar, was nach der Generierung gelten muss. Nennen Sie Eindeutigkeit, Null-Raten, Datumsbereiche, erlaubte Enums, Foreign-Key-artige Beziehungen und Formatvorgaben. Für dummy-dataset bei Data Cleaning sollten Sie absichtlich kontrollierte Fehler anfordern, damit der Datensatz Ihre Cleaning-Logik tatsächlich testet.

Von Defekten aus iterieren, nicht von Vorlieben

Richten Sie Ihre Überarbeitung nach der ersten Ausgabe auf das, was den Workflow tatsächlich gestört hat: schlechte Spaltennamen, unrealistische Wertebereiche, fehlende Edge Cases oder ein Format, das sich schwer laden lässt. Bitten Sie dann um eine korrigierte dummy-dataset-Version mit ein oder zwei konkreten Änderungen, statt die gesamte Anfrage noch einmal zu wiederholen. So bleibt die Ausgabe praxisnah und wird nicht auf kosmetische Details überoptimiert.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

lamindb

von K-Dense-AI

Die lamindb-Skill hilft dir bei der Arbeit mit LaminDB, einem Open-Source-Framework für biologische Daten, das Daten abfragbar, nachvollziehbar, reproduzierbar und FAIR macht. Nutze sie für lamindb bei der Datenanalyse, Metadatenkuratierung, ontologiebasierten Annotation, Schema-Validierung und lineage-bewussten Workflows in Notebooks und Pipelines.

Data Analysis

Favoriten 0GitHub 0

exploratory-data-analysis

von K-Dense-AI

Die exploratory-data-analysis-Skill verwandelt wissenschaftliche Dateien in formatbewusste EDA-Berichte. Sie erkennt den Dateityp, fasst Struktur und Qualität zusammen, extrahiert wichtige Metadaten und schlägt Folgeanalysen vor. Nutzen Sie sie für exploratory-data-analysis zur Datenanalyse in Chemie, Bioinformatik, Mikroskopie, Spektroskopie, Proteomik, Metabolomik und anderen wissenschaftlichen Dateiformaten.

Data Analysis

Favoriten 0GitHub 0

read-file

von duckdb

read-file hilft einem Agenten dabei, CSV-, JSON-, Parquet-, Avro-, Excel-, SQLite-, Geodaten-Dateien oder entfernte URLs mit DuckDB zu lesen und zu prüfen. Nutze es, um Zeilen vorzuschauen, das Schema zu prüfen, Daten zu profilieren und zu beantworten, was in dieser Datei steckt. Am besten eignet sich read-file für echte Datenartefakte, nicht für Quellcode.

Office Documents

Favoriten 0GitHub 443

data-quality-frameworks

von wshobson

Die data-quality-frameworks Skill unterstützt Teams dabei, die Validierung von Produktionsdaten mit dbt tests, Great Expectations und Data Contracts zu planen. Nutzen Sie sie, um die passenden Prüfungen auszuwählen, sie einer Testing-Pyramide zuzuordnen und CI/CD-taugliche Data-Quality-Workflows für Data Cleaning und zuverlässige Pipelines aufzusetzen.

Data Cleaning

Favoriten 0GitHub 32.6k

data-analyst

von Shubhamsaboo

data-analyst ist ein schlankes GitHub-Skill, das Agents bei SQL, pandas und grundlegender statistischer Analyse für die Datenexploration anleitet. Am besten geeignet für Nutzer, die codegestützte Abfragen, Transformationen und Interpretationen aus einer einzigen SKILL.md-Prompt-Schicht erhalten möchten.

Data Analysis

Favoriten 0GitHub 104.2k

frontend-design

von anthropics

frontend-design verwandelt vage UI-Ideen in markante, produktionsreife Interfaces mit echtem Frontend-Code, klarer Designrichtung und weniger generischem AI-Look.

UI Design

Favoriten 1GitHub 105.2k

create-colleague

von titanwings

create-colleague macht aus Dokumenten, Chats, E-Mails, Screenshots, Feishu- und DingTalk-Daten von Kolleg:innen ein bearbeitbares AI-Skill mit getrennten Ausgaben für Arbeitsweise und Persona sowie Update-Abläufen für die laufende Verfeinerung.

Skill Authoring

Favoriten 1GitHub 747

hyperframes

von heygen-com

hyperframes ist eine Workflow-Skill zum Erstellen von HTML-basierten Videokompositionen in HyperFrames. Nutze sie für Title Cards, Overlays, Untertitel, Voiceovers, audio-reactive Motion und Szenenübergänge, wenn du strukturierte, code-first hyperframes für Videoediting brauchst. Der Fokus liegt stärker auf Layout, Timing und Animation als auf allgemeinen Prompt-only-Videoanfragen.

Video Editing

Favoriten 0GitHub 2.7k

kreuzberg

von kreuzberg-dev

Die kreuzberg-Skill hilft dir, Kreuzberg zu installieren und für die Dokumentextraktion aus über 91 Formaten zu nutzen – darunter PDFs, Office-Dateien, Bilder, HTML, E-Mails und Archive. Abgedeckt werden Python-, Node.js-/TypeScript-, Rust- und CLI-Workflows für OCR, Tabellen, Metadaten, Stapelverarbeitung und praxisnahe Hinweise zum Parsen.

PDF Processing

Favoriten 0GitHub 0

skill-creator

von anthropics

skill-creator ist eine Meta-Skill zur Skill-Erstellung: neue Skills entwerfen, bestehende `SKILL.md` überarbeiten, Evals ausführen, Varianten vergleichen und Trigger-Beschreibungen mit Repo-Skripten und Review-Tools verbessern.

Skill Authoring

Favoriten 2GitHub 105.1k

azure-identity-py

von microsoft

azure-identity-py hilft dabei, Azure-Authentifizierung in Python mit Microsoft Entra ID einzurichten. Verwenden Sie es, um zwischen DefaultAzureCredential, Managed Identity oder Service-Principal-Authentifizierung zu wählen, Umgebungsvariablen zu konfigurieren und Probleme mit Zugriffskontrolle sowie der Credential-Kette zu beheben. Hinweise zur Installation, Nutzungsmuster und praktische Setup-Notizen basieren auf der Skill-Datei des Repos.

Access Control

Favoriten 0GitHub 2.2k

claude-api

von anthropics

claude-api ist ein praxisnahes Skill für Installation und Nutzung der Claude API und der Anthropic SDKs. Es hilft Entwicklern, den passenden SDK- oder HTTP-Weg zu wählen, sprachspezifische Doku zu finden und Streaming, Tool Use, Dateien, Batches und Fehlerbehandlung sicher umzusetzen.

API Development

Favoriten 0GitHub 105k

wrangler

von cloudflare

Die wrangler-Skill hilft dir, die richtigen CLI-Befehle, Konfigurationsstrukturen und Deploy-Schritte für Cloudflare Workers zu finden. Nutze sie für die wrangler-Verwendung, wrangler-Installationsprüfungen und als praxisnahen wrangler-Leitfaden beim Entwickeln oder Ausliefern von Workers für Backend Development.

Backend Development

Favoriten 0GitHub 1.3k

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

clickhouse-architecture-advisor

von ClickHouse

clickhouse-architecture-advisor hilft bei der Gestaltung von ClickHouse-Workloads mit workloadbewussten Entscheidungen für Ingestion, Partitionierung, Joins, Dictionaries, Upserts und Voraggregation. Besonders nützlich ist das Skill für Backend-Entwicklung, Observability, SIEM, Produktanalysen, IoT-Telemetrie und Finanzpipelines. Das Skill kennzeichnet Empfehlungen als `official`, `derived` oder `field`.

Backend Development

Favoriten 0GitHub 412

figma-generate-library

von figma

figma-generate-library hilft dir, ein Figma-Designsystem aus einer Codebasis aufzubauen oder zu aktualisieren – mit einem klaren, abgestuften Workflow für Tokens, Component Libraries, Dokumentation sowie Light/Dark-Theming. Nutze den figma-generate-library Skill, wenn du einen praxisnahen Leitfaden für Design Systems brauchst und nicht nur ein einmaliges Mockup. Er ergänzt figma-use für Plugin-API-Aufrufe.

Design Systems

Favoriten 0GitHub 0