Data Processing

Data Processing taxonomy generated by the site skill importer.

15 skills
A
regex-vs-llm-structured-text

por affaan-m

Skill regex-vs-llm-structured-text para escolher entre regex ou LLM na extração de texto estruturado. Comece com parsing determinístico, adicione validação com LLM para casos extremos de baixa confiança e use um pipeline mais barato e confiável para documentos, formulários, notas fiscais e análise de dados.

Data Analysis
Favoritos 0GitHub 156.2k
K
omero-integration

por K-Dense-AI

skill omero-integration para fluxos de trabalho em Python com OMERO no Backend Development. Conecte ao OMERO, recupere projetos, datasets, imagens, ROIs, anotações e tabelas, e rode scripts em lote com menos tentativa e erro.

Backend Development
Favoritos 0GitHub 21.3k
K
hypogenic

por K-Dense-AI

hypogenic é uma skill para gerar e testar hipóteses em datasets tabulares ou derivados de texto, com suporte de LLM. Ela ajuda na análise de dados com hypogenic ao transformar perguntas empíricas em fluxos de trabalho estruturados e testáveis para interpretação de classificação, análise de conteúdo e detecção de enganos. Use quando você precisar de hipóteses com base em evidências, não apenas de brainstorming.

Data Analysis
Favoritos 0GitHub 21.3k
K
dnanexus-integration

por K-Dense-AI

dnanexus-integration é uma skill prática para trabalhos de genômica na nuvem com DNAnexus. Use-a para criar apps e applets, gerenciar uploads e downloads, executar workflows e automatizar pipelines com dxpy. O guia dnanexus-integration ajuda em tarefas de Desenvolvimento Backend que envolvem arquivos FASTQ, BAM e VCF, além de configuração específica da plataforma e execução de jobs.

Backend Development
Favoritos 0GitHub 21.3k
H
huggingface-datasets

por huggingface

Use a skill huggingface-datasets para fluxos de trabalho da API do Dataset Viewer do Hugging Face: validar datasets, resolver splits, pré-visualizar e paginar linhas, buscar texto, aplicar filtros e obter links de parquet ou estatísticas. É um guia prático de huggingface-datasets para exploração somente leitura de datasets.

Web Scraping
Favoritos 0GitHub 10.4k
V
Workspace Data Analyst

por VoltAgent

Workspace Data Analyst é uma skill leve para análise de dados no seu workspace. Ela analisa arquivos CSV, verifica cabeçalhos, resume totais, médias e outliers, e fornece insights curtos com próximos passos. A skill Workspace Data Analyst é ideal para revisões rápidas com contexto de arquivo antes de um modelamento mais profundo.

Data Analysis
Favoritos 0GitHub 8.5k
M
azure-storage-file-datalake-py

por microsoft

azure-storage-file-datalake-py é a skill em Python para Azure Data Lake Storage Gen2. Ela ajuda desenvolvedores de backend e agentes a instalar, autenticar e usar o Azure SDK em tarefas de sistema de arquivos hierárquico, como listar, enviar, baixar e gerenciar diretórios e arquivos.

Backend Development
Favoritos 0GitHub 2.3k
M
azure-cosmos-py

por microsoft

A skill azure-cosmos-py ajuda você a instalar, configurar e usar o SDK Python do Azure Cosmos DB para CRUD em NoSQL, consultas, configuração de containers, particionamento e autenticação. É especialmente útil para fluxos de trabalho de Engenharia de Banco de Dados em que chave de partição e custo de consulta fazem diferença.

Database Engineering
Favoritos 0GitHub 2.2k
C
clickhouse-best-practices

por ClickHouse

clickhouse-best-practices é uma skill de melhores práticas para ClickHouse voltada para Engenharia de Banco de Dados. Ela orienta o desenho de schema, a otimização de queries, a estratégia de inserts e a conectividade com agentes por meio de recomendações baseadas em regras, deixando o uso de clickhouse-best-practices mais fácil de acionar, revisar e citar em fluxos de trabalho do ClickHouse.

Database Engineering
Favoritos 0GitHub 412
T
tinybird

por tinybirdco

Boas práticas do Tinybird para arquivos de projeto, regras de SQL, padrões de otimização e fluxos de trabalho baseados em arquivos. Use este skill tinybird em Backend Development quando precisar de ajuda com datasources, pipes, endpoints, materialized views e orientação segura para deploy, com base nas regras do repositório.

Backend Development
Favoritos 0GitHub 16
K
pymatgen

por K-Dense-AI

pymatgen é um toolkit em Python para ciência dos materiais, voltado a estruturas cristalinas, diagramas de fase, estrutura eletrônica e conversão de arquivos. Esta skill de pymatgen ajuda em fluxos de trabalho científicos com CIF, POSCAR, VASP e dados do Materials Project.

Scientific
Favoritos 0GitHub 0
K
exploratory-data-analysis

por K-Dense-AI

A skill exploratory-data-analysis transforma arquivos científicos em relatórios de EDA sensíveis ao formato. Ela detecta o tipo de arquivo, resume estrutura e qualidade, extrai metadados-chave e sugere análises subsequentes. Use-a para exploratory-data-analysis em Análise de Dados em química, bioinformática, microscopia, espectroscopia, proteômica, metabolômica e outros formatos de arquivos científicos.

Data Analysis
Favoritos 0GitHub 0
K
astropy

por K-Dense-AI

astropy é um toolkit em Python para fluxos de trabalho de astronomia e astrofísica. Use esta skill astropy para coordenadas celestes, unidades, arquivos FITS, escalas de tempo, tabelas, WCS, cosmologia e análise de dados com astropy. Ela ajuda em tarefas práticas de astronomia, como transformações de coordenadas, conversão de unidades e processamento de dados.

Data Analysis
Favoritos 0GitHub 0
K
aeon

por K-Dense-AI

aeon é uma skill em Python compatível com scikit-learn para machine learning de séries temporais. Use-a para classificação, regressão, clustering, previsão, detecção de anomalias, segmentação, busca por similaridade e outros fluxos de trabalho com dados temporais. Ela se encaixa bem em análises univariadas e multivariadas quando você precisa de métodos especializados além do ML tabular genérico.

Data Analysis
Favoritos 0GitHub 0
S
postgres

por sanjay3290

A skill postgres permite inspecionar bancos de dados PostgreSQL ao vivo com SQL somente leitura. Use-a para descoberta de schema, verificação de tabelas e análises baseadas em SELECT em várias conexões, com auto-seleção baseada em descrição. Ela foi criada para fluxos de trabalho de Database Engineering e bloqueia comandos de escrita como INSERT, UPDATE, DELETE e DROP para manter a segurança.

Database Engineering
Favoritos 0GitHub 0
Data Processing