dummy-dataset

por phuryn

A skill dummy-dataset gera dados de teste realistas em formato CSV, JSON, SQL ou script Python. Ela ajuda na criação de datasets fictícios, demos, seed de banco de dados, QA e limpeza de dados, permitindo definir colunas, quantidade de linhas e restrições para produzir registros de exemplo convincentes.

Estrelas11.1k

Favoritos0

Comentários0

Adicionado12 de mai. de 2026

CategoriaData Cleaning

Comando de instalação

npx skills add phuryn/pm-skills --skill dummy-dataset

Pontuação editorial

Esta skill recebe 68/100, o que significa que é aceitável para listar, mas deve ser apresentada com ressalvas. Para quem usa o diretório, ela traz um propósito claramente definido, argumentos utilizáveis e um fluxo passo a passo de geração que ajuda um agente a acioná-la com menos tentativa e erro do que um prompt genérico. No entanto, parece limitada a um único `SKILL.md`, sem scripts ou referências de apoio, então a confiança na adoção é moderada, não alta.

68/100

Pontos fortes

Gatilho e caso de uso claros: gerar datasets falsos realistas para testes, demos e desenvolvimento.
A estrutura operacional é explícita, com argumentos nomeados para produto, tipo de dataset, linhas, colunas, formato e restrições.
O fluxo passo a passo, junto com os formatos de saída (CSV, JSON, SQL, script Python), dá aos agentes um caminho concreto de execução.

Pontos de atenção

A evidência do repositório não mostra scripts, referências ou recursos de apoio, então a confiança e a profundidade ficam limitadas ao texto do prompt.
Sinais de caráter experimental/de teste indicam que ela é mais indicada para tarefas com dados de amostra, não para fluxos de geração de dados em nível de produção.

Dataset CSV Json Sql Python

Visão geral

Visão geral do skill dummy-dataset

O que o dummy-dataset faz

O skill dummy-dataset ajuda você a gerar dados de teste realistas com rapidez: CSV, JSON, SQL ou até um script em Python que possa produzir os dados depois. Ele é ideal para quem precisa de registros de exemplo críveis para QA, demos, seed data ou um pipeline de protótipo — não apenas de preenchimento aleatório. O verdadeiro valor do skill dummy-dataset é permitir que você descreva o domínio, as colunas, a quantidade de linhas e as restrições para que a saída fique útil, em vez de obviamente sintética.

Quando este skill é a melhor escolha

Use dummy-dataset para Data Cleaning, testes de produto, mockups analíticos, validação de formulários e seed de banco de dados quando você precisar de dados que pareçam coerentes entre os campos. Ele é uma ótima opção se você se importa com relações como datas, categorias, IDs ou faixas realistas. Ele é menos útil se você só precisa de exemplos pontuais e simples, ou se sua tarefa já depende de um schema real disponível em produção.

O que o torna diferente

Ao contrário de um prompt genérico, o skill dummy-dataset já é orientado desde o início para o formato de saída e para as restrições. Isso faz diferença quando você precisa de dados que realmente possa importar ou executar, e não apenas ler. O principal ponto de decisão é se você quer arquivos prontos para uso ou um script de geração reproduzível; este skill suporta os dois.

Como usar o skill dummy-dataset

Instale o dummy-dataset

Instale o skill dummy-dataset no seu ambiente de skills com:

npx skills add phuryn/pm-skills --skill dummy-dataset

Depois da instalação, abra primeiro o arquivo do skill para entender os inputs esperados e os estilos de saída antes de acioná-lo em um fluxo maior.

Leia primeiro os arquivos certos

Comece com SKILL.md e, em seguida, confira README.md, AGENTS.md, metadata.json e quaisquer pastas rules/, resources/, references/ ou scripts/, se existirem no seu ambiente. Neste repositório, SKILL.md é a principal fonte de verdade, porque o skill é compacto e não depende de arquivos de apoio. Se você estiver usando dummy-dataset em um fluxo real, leia o template de geração e as seções de exemplos antes de pedir a saída final.

Dê um prompt que o skill consiga executar

Um bom pedido de uso do dummy-dataset deve incluir o objetivo do conjunto de dados, os campos, a quantidade de linhas, o formato e as restrições. Por exemplo: “Gere um dummy-dataset de 500 linhas para um app SaaS de billing com colunas customer_id, plan, signup_date, churned e MRR em CSV; mantenha IDs únicos, datas dentro dos últimos 18 meses e churned consistente com o status da assinatura.” Isso é muito melhor do que “faça dados de exemplo”, porque dá estrutura suficiente para o skill manter o dataset plausível.

Melhor fluxo para qualidade de saída

Use o skill em duas etapas: primeiro defina a especificação do dataset, depois refine a saída após verificar se os campos e as restrições estão realistas. Se você precisar de dummy-dataset para Data Cleaning, peça casos-limite de propósito, como valores ausentes, duplicatas, e-mails malformados ou formatos de data inconsistentes. Se você precisar de um script, informe logo de cara a linguagem e o contexto de execução para que a saída combine com a sua ferramenta.

Perguntas frequentes sobre o skill dummy-dataset

O dummy-dataset é bom para dados de teste com cara de produção?

Sim, se você precisa de registros mock críveis com estrutura controlada. O skill dummy-dataset é útil quando ferramentas downstream dependem de consistência entre campos, mas ainda assim são dados sintéticos — portanto, não devem ser tratados como dados reais de usuários nem como um modelo estatístico do seu negócio.

Preciso saber programar para usar?

Não. Quem está começando pode usar dummy-dataset descrevendo o conjunto de dados em linguagem natural e especificando o formato desejado. Inputs mais precisos melhoram o resultado, mas você não precisa escrever código a menos que queira um script em Python ou uma saída de inserts em SQL.

Quando não devo usar este skill?

Não use dummy-dataset quando você precisar de anonimização de registros reais, geração de dados sintéticos em conformidade legal ou uma cópia exata de um schema de produção com restrições sensíveis. Nesses casos, um pipeline de dados dedicado ou uma ferramenta com foco em privacidade pode ser mais adequado do que um guia de dummy-dataset baseado em prompt.

Ele é melhor do que um prompt normal?

Geralmente sim, porque o skill dummy-dataset força você a definir colunas, regras de negócio e formato de saída ao mesmo tempo. Um prompt comum frequentemente deixa uma dessas partes de fora, o que gera dados que parecem bons à primeira vista, mas falham na importação, nos testes ou na validação.

Como melhorar o skill dummy-dataset

Envie uma especificação de dataset mais precisa

O maior ganho de qualidade vem de especificar o domínio em termos de campos e regras, e não só de um tema. Em vez de “gere dados de clientes”, peça campos concretos como customer_id, segment, signup_date, lifetime_value e status, além de regras como “lifetime_value deve variar por segmento” ou “signup_date não pode estar no futuro”. Isso torna o skill dummy-dataset muito mais confiável.

Adicione as restrições que importam no fluxo seguinte

Se você pretende limpar, validar ou importar os dados, diga o que precisa ser verdade depois da geração. Mencione unicidade, taxa de nulos, intervalos de datas, enums permitidos, relações no estilo chave estrangeira e requisitos de formato. Para dummy-dataset para Data Cleaning, peça erros controlados de propósito para que o conjunto realmente exercite sua lógica de limpeza.

Itere a partir de defeitos, não de preferências

Depois da primeira saída, concentre a revisão no que quebrou o fluxo: nomes de colunas ruins, faixas irreais, ausência de casos-limite ou um formato difícil de carregar. Depois, peça uma versão corrigida do dummy-dataset com uma ou duas mudanças específicas, em vez de repetir todo o pedido. Isso mantém a saída prática e evita um ajuste excessivo a detalhes cosméticos.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

lamindb

por K-Dense-AI

A skill lamindb ajuda você a trabalhar com o LaminDB, um framework open source para dados de biologia que torna os dados consultáveis, rastreáveis, reproduzíveis e FAIR. Use para lamindb em análise de dados, curadoria de metadados, anotação baseada em ontologia, validação de schema e fluxos de trabalho com noção de linhagem em notebooks e pipelines.

Data Analysis

Favoritos 0GitHub 0

exploratory-data-analysis

por K-Dense-AI

A skill exploratory-data-analysis transforma arquivos científicos em relatórios de EDA sensíveis ao formato. Ela detecta o tipo de arquivo, resume estrutura e qualidade, extrai metadados-chave e sugere análises subsequentes. Use-a para exploratory-data-analysis em Análise de Dados em química, bioinformática, microscopia, espectroscopia, proteômica, metabolômica e outros formatos de arquivos científicos.

Data Analysis

Favoritos 0GitHub 0

read-file

por duckdb

O read-file ajuda um agente a ler e inspecionar CSV, JSON, Parquet, Avro, Excel, SQLite, arquivos espaciais ou URLs remotas com DuckDB. Use-o para pré-visualizar linhas, verificar o schema, perfilar dados e responder ao que há neste arquivo. É mais indicado para uso com read-file em dados reais, não em código-fonte.

Office Documents

Favoritos 0GitHub 443

data-quality-frameworks

por wshobson

A skill data-quality-frameworks ajuda equipes a planejar a validação de dados em produção com testes do dbt, Great Expectations e data contracts. Use-a para escolher as verificações certas, mapeá-las para uma pirâmide de testes e orientar fluxos de qualidade de dados prontos para CI/CD em Data Cleaning e confiabilidade de pipelines.

Data Cleaning

Favoritos 0GitHub 32.6k

data-analyst

por Shubhamsaboo

data-analyst é uma skill enxuta do GitHub que orienta agentes a usar SQL, pandas e análise estatística básica na exploração de dados. É mais indicada para quem quer consultas, transformações e interpretações com base em código, a partir de uma única camada de prompt em SKILL.md.

Data Analysis

Favoritos 0GitHub 104.2k

frontend-design

por anthropics

frontend-design transforma ideias vagas de UI em interfaces marcantes e prontas para produção, com código frontend real, direção estética clara e menos visual genérico de IA.

UI Design

Favoritos 1GitHub 105.2k

create-colleague

por titanwings

create-colleague transforma documentos, chats, emails, capturas de tela, dados do Feishu e do DingTalk de colegas em uma skill de IA editável, com saídas separadas de trabalho e persona, além de fluxos de atualização para refinamento contínuo.

Skill Authoring

Favoritos 1GitHub 747

hyperframes

por heygen-com

hyperframes é uma skill de fluxo de trabalho para criar composições de vídeo baseadas em HTML no HyperFrames. Use-a para cards de título, sobreposições, legendas, narração, movimento reativo ao áudio e transições de cena quando precisar de hyperframes estruturados e orientados por código para Edição de Vídeo. Ela prioriza decisões de layout, tempo e animação em vez de pedidos genéricos de vídeo só com prompt.

Video Editing

Favoritos 0GitHub 2.7k

kreuzberg

por kreuzberg-dev

A skill kreuzberg ajuda você a instalar e usar o Kreuzberg para extração de documentos em mais de 91 formatos, incluindo PDFs, arquivos do Office, imagens, HTML, e-mail e arquivos compactados. Ela cobre fluxos de trabalho em Python, Node.js/TypeScript, Rust e CLI para OCR, tabelas, metadados, processamento em lote e orientações práticas de parsing.

PDF Processing

Favoritos 0GitHub 0

skill-creator

por anthropics

skill-creator é uma meta-skill de criação de Skills para rascunhar novas skills, revisar arquivos SKILL.md, rodar evals, comparar variantes e melhorar descrições de trigger com scripts e ferramentas de revisão do repositório.

Skill Authoring

Favoritos 2GitHub 105.1k

azure-identity-py

por microsoft

azure-identity-py ajuda a configurar autenticação Azure em Python com o Microsoft Entra ID. Use-o para escolher entre `DefaultAzureCredential`, managed identity ou autenticação por service principal, configurar variáveis de ambiente e resolver problemas de controle de acesso e da cadeia de credenciais. As orientações de instalação, os padrões de uso e as notas práticas de configuração são baseados no arquivo de skill do repositório.

Access Control

Favoritos 0GitHub 2.2k

claude-api

por anthropics

claude-api é uma skill prática para instalar e usar a Claude API e os SDKs da Anthropic. Ajuda desenvolvedores a escolher entre o SDK certo ou HTTP bruto, encontrar a documentação por linguagem e implementar streaming, tool use, arquivos, batches e tratamento de erros com menos tentativa e erro.

API Development

Favoritos 0GitHub 105k

wrangler

por cloudflare

A skill wrangler ajuda você a encontrar os comandos corretos de CLI, os formatos de configuração e as etapas de deploy para Cloudflare Workers. Use-a para uso do wrangler, checagens de instalação do wrangler e um guia prático de wrangler ao criar ou publicar Workers para Backend Development.

Backend Development

Favoritos 0GitHub 1.3k

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices é uma skill de melhores práticas para ClickHouse voltada para Engenharia de Banco de Dados. Ela orienta o desenho de schema, a otimização de queries, a estratégia de inserts e a conectividade com agentes por meio de recomendações baseadas em regras, deixando o uso de clickhouse-best-practices mais fácil de acionar, revisar e citar em fluxos de trabalho do ClickHouse.

Database Engineering

Favoritos 0GitHub 412

clickhouse-architecture-advisor

por ClickHouse

clickhouse-architecture-advisor ajuda a projetar workloads no ClickHouse com decisões orientadas pela carga de trabalho para ingestão, particionamento, joins, dicionários, upserts e pré-agregação. É especialmente útil para Desenvolvimento Backend, observabilidade, SIEM, analytics de produto, telemetria de IoT e pipelines financeiros. O skill classifica as orientações como official, derived ou field.

Backend Development

Favoritos 0GitHub 412

figma-generate-library

por figma

A skill figma-generate-library ajuda você a criar ou atualizar um sistema de design no Figma a partir de uma base de código, com um fluxo organizado para tokens, bibliotecas de componentes, documentação e temas claro/escuro. Use a skill figma-generate-library quando precisar de um guia prático para Design Systems, e não de um mockup pontual. Ela complementa a figma-use para chamadas à Plugin API.

Design Systems

Favoritos 0GitHub 0