Data Processing

Data Processing taxonomy generated by the site skill importer.

17 skills

regex-vs-llm-structured-text

por affaan-m

Skill regex-vs-llm-structured-text para escolher entre regex ou LLM na extração de texto estruturado. Comece com parsing determinístico, adicione validação com LLM para casos extremos de baixa confiança e use um pipeline mais barato e confiável para documentos, formulários, notas fiscais e análise de dados.

Data Analysis

Favoritos 0GitHub 156.2k

college-football-data-automation

por ComposioHQ

college-football-data-automation ajuda agentes a automatizar tarefas de College Football Data por meio do Rube MCP e da Composio. Veja os requisitos de configuração, a descoberta de ferramentas com RUBE_SEARCH_TOOLS, as verificações de conexão e padrões práticos de uso.

Workflow Automation

Favoritos 0GitHub 67.5k

cloudconvert-automation

por ComposioHQ

cloudconvert-automation ajuda agentes a executar conversões de formato no CloudConvert via Rube MCP, pesquisando primeiro schemas de ferramentas em tempo real, verificando a conexão com o cloudconvert e evitando campos de API desatualizados.

Format Conversion

Favoritos 0GitHub 67.5k

omero-integration

por K-Dense-AI

skill omero-integration para fluxos de trabalho em Python com OMERO no Backend Development. Conecte ao OMERO, recupere projetos, datasets, imagens, ROIs, anotações e tabelas, e rode scripts em lote com menos tentativa e erro.

Backend Development

Favoritos 0GitHub 21.3k

hypogenic

por K-Dense-AI

hypogenic é uma skill para gerar e testar hipóteses em datasets tabulares ou derivados de texto, com suporte de LLM. Ela ajuda na análise de dados com hypogenic ao transformar perguntas empíricas em fluxos de trabalho estruturados e testáveis para interpretação de classificação, análise de conteúdo e detecção de enganos. Use quando você precisar de hipóteses com base em evidências, não apenas de brainstorming.

Data Analysis

Favoritos 0GitHub 21.3k

dnanexus-integration

por K-Dense-AI

dnanexus-integration é uma skill prática para trabalhos de genômica na nuvem com DNAnexus. Use-a para criar apps e applets, gerenciar uploads e downloads, executar workflows e automatizar pipelines com dxpy. O guia dnanexus-integration ajuda em tarefas de Desenvolvimento Backend que envolvem arquivos FASTQ, BAM e VCF, além de configuração específica da plataforma e execução de jobs.

Backend Development

Favoritos 0GitHub 21.3k

huggingface-datasets

por huggingface

Use a skill huggingface-datasets para fluxos de trabalho da API do Dataset Viewer do Hugging Face: validar datasets, resolver splits, pré-visualizar e paginar linhas, buscar texto, aplicar filtros e obter links de parquet ou estatísticas. É um guia prático de huggingface-datasets para exploração somente leitura de datasets.

Web Scraping

Favoritos 0GitHub 10.4k

Workspace Data Analyst

por VoltAgent

Workspace Data Analyst é uma skill leve para análise de dados no seu workspace. Ela analisa arquivos CSV, verifica cabeçalhos, resume totais, médias e outliers, e fornece insights curtos com próximos passos. A skill Workspace Data Analyst é ideal para revisões rápidas com contexto de arquivo antes de um modelamento mais profundo.

Data Analysis

Favoritos 0GitHub 8.5k

azure-storage-file-datalake-py

por microsoft

azure-storage-file-datalake-py é a skill em Python para Azure Data Lake Storage Gen2. Ela ajuda desenvolvedores de backend e agentes a instalar, autenticar e usar o Azure SDK em tarefas de sistema de arquivos hierárquico, como listar, enviar, baixar e gerenciar diretórios e arquivos.

Backend Development

Favoritos 0GitHub 2.3k

azure-cosmos-py

por microsoft

A skill azure-cosmos-py ajuda você a instalar, configurar e usar o SDK Python do Azure Cosmos DB para CRUD em NoSQL, consultas, configuração de containers, particionamento e autenticação. É especialmente útil para fluxos de trabalho de Engenharia de Banco de Dados em que chave de partição e custo de consulta fazem diferença.

Database Engineering

Favoritos 0GitHub 2.2k

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices é uma skill de melhores práticas para ClickHouse voltada para Engenharia de Banco de Dados. Ela orienta o desenho de schema, a otimização de queries, a estratégia de inserts e a conectividade com agentes por meio de recomendações baseadas em regras, deixando o uso de clickhouse-best-practices mais fácil de acionar, revisar e citar em fluxos de trabalho do ClickHouse.

Database Engineering

Favoritos 0GitHub 412

tinybird

por tinybirdco

Boas práticas do Tinybird para arquivos de projeto, regras de SQL, padrões de otimização e fluxos de trabalho baseados em arquivos. Use este skill tinybird em Backend Development quando precisar de ajuda com datasources, pipes, endpoints, materialized views e orientação segura para deploy, com base nas regras do repositório.

Backend Development

Favoritos 0GitHub 16

pymatgen

por K-Dense-AI

pymatgen é um toolkit em Python para ciência dos materiais, voltado a estruturas cristalinas, diagramas de fase, estrutura eletrônica e conversão de arquivos. Esta skill de pymatgen ajuda em fluxos de trabalho científicos com CIF, POSCAR, VASP e dados do Materials Project.

Scientific

Favoritos 0GitHub 0

exploratory-data-analysis

por K-Dense-AI

A skill exploratory-data-analysis transforma arquivos científicos em relatórios de EDA sensíveis ao formato. Ela detecta o tipo de arquivo, resume estrutura e qualidade, extrai metadados-chave e sugere análises subsequentes. Use-a para exploratory-data-analysis em Análise de Dados em química, bioinformática, microscopia, espectroscopia, proteômica, metabolômica e outros formatos de arquivos científicos.

Data Analysis

Favoritos 0GitHub 0

astropy

por K-Dense-AI

astropy é um toolkit em Python para fluxos de trabalho de astronomia e astrofísica. Use esta skill astropy para coordenadas celestes, unidades, arquivos FITS, escalas de tempo, tabelas, WCS, cosmologia e análise de dados com astropy. Ela ajuda em tarefas práticas de astronomia, como transformações de coordenadas, conversão de unidades e processamento de dados.

Data Analysis

Favoritos 0GitHub 0

aeon

por K-Dense-AI

aeon é uma skill em Python compatível com scikit-learn para machine learning de séries temporais. Use-a para classificação, regressão, clustering, previsão, detecção de anomalias, segmentação, busca por similaridade e outros fluxos de trabalho com dados temporais. Ela se encaixa bem em análises univariadas e multivariadas quando você precisa de métodos especializados além do ML tabular genérico.

Data Analysis

Favoritos 0GitHub 0

postgres

por sanjay3290

A skill postgres permite inspecionar bancos de dados PostgreSQL ao vivo com SQL somente leitura. Use-a para descoberta de schema, verificação de tabelas e análises baseadas em SELECT em várias conexões, com auto-seleção baseada em descrição. Ela foi criada para fluxos de trabalho de Database Engineering e bloqueia comandos de escrita como INSERT, UPDATE, DELETE e DROP para manter a segurança.

Database Engineering

Favoritos 0GitHub 0