pytdc

por K-Dense-AI

pytdc é uma skill para o Therapeutics Data Commons, oferecendo datasets e benchmarks prontos para IA em descoberta de fármacos para ADME, toxicidade, DTI, DDI, geração, splits por scaffold e predição farmacológica.

Estrelas0

Favoritos0

Comentários0

Adicionado14 de mai. de 2026

CategoriaData Analysis

Comando de instalação

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

Pontuação editorial

Esta skill recebe 78/100, o que a coloca como uma boa candidata para usuários do diretório que precisam de um fluxo prático de PyTDC para ML em terapias. O repositório traz detalhe operacional suficiente para ajudar um agente a entender quando usar, instalar e trabalhar com tarefas-chave de datasets e benchmarks com menos improviso do que um prompt genérico.

78/100

Pontos fortes

Os casos de uso explícitos cobrem ADME, toxicidade, interação droga-alvo, geração de moléculas e avaliação de benchmarks.
Os comandos de instalação e atualização vêm com um caminho concreto via pip/uv, o que melhora a acionabilidade e a adoção.
Um SKILL.md longo e estruturado, com բազմաթիվ headings e seções de workflow, sugere orientação operacional substancial em vez de um placeholder.

Pontos de atenção

A árvore do repositório não mostra scripts, referências, recursos nem metadados de comando de instalação além de SKILL.md, então alguns fluxos podem depender apenas de instruções narrativas.
O trecho indica cobertura ampla, mas não mostra aqui um quick start completo de ponta a ponta, então ainda pode haver tentativa e erro para tarefas específicas.

Python Dataset Benchmarking Machine Learning Drug Discovery Therapeutic

Visão geral

Visão geral do skill pytdc

Para que serve o pytdc

pytdc é o skill para usar o Therapeutics Data Commons em workflows de descoberta de fármacos guiados por IA. Ele ajuda você a chegar a datasets curados e prontos para IA, além de benchmarks para ADME, toxicidade, bioatividade, interação fármaco-alvo, interação fármaco-fármaco, geração e tarefas relacionadas de avaliação, sem precisar inventar seu próprio esquema de dados.

Quem deve instalar

Instale o skill pytdc se você trabalha com ML terapêutico, previsão farmacológica ou benchmarking de modelos com splits e métricas padronizados. Ele é uma boa escolha para cientistas de dados que precisam de acesso reproduzível a datasets; já é uma opção menos indicada se você só quer um prompt genérico de química, sem etapa de carregamento de dados ou avaliação.

Por que isso importa

O principal valor do skill pytdc não é só o acesso aos datasets, mas a estrutura ao redor disso: loaders específicos por tarefa, splits padrão como scaffold ou cold splits e escolhas de avaliação amigáveis para benchmarks. Isso reduz os bloqueios comuns na adoção de workflows de descoberta de fármacos, em que pré-processamentos inconsistentes e divisões ad hoc podem tornar os resultados difíceis de confiar.

Como usar o skill pytdc

Instale o pytdc no seu ambiente

Use primeiro o comando de instalação das instruções do skill:
uv pip install PyTDC

Para atualizar uma instalação existente, use:
uv pip install PyTDC --upgrade

Se o seu fluxo usa um gerenciador de pacotes diferente, mapeie o mesmo nome do pacote para esse ambiente em vez de reescrever as premissas do skill.

Comece pelos arquivos certos

Comece com SKILL.md e depois leia as seções de overview, when to use, installation e quick start antes de ir direto para o código. Se precisar de contexto mais amplo do projeto, examine qualquer documentação próxima exposta pela árvore de arquivos do repo por meio do arquivo de skill; neste repositório, o próprio conteúdo do skill é a principal fonte de verdade.

Transforme um objetivo vago em um prompt útil

O pytdc usage funciona melhor quando o seu prompt nomeia a tarefa, a família do dataset, a estratégia de split e o objetivo de saída. Por exemplo, em vez de pedir “ajuda com PyTDC”, peça:

“Carregue um dataset de ADME em pytdc, use um scaffold split e prepare um workflow de regressão baseline.”
“Mostre um pytdc guide para benchmarking de DTI com splits de treino/validação/teste e reporte de métricas.”
“Configure pytdc for Data Analysis em um dataset de toxicidade e resuma balanceamento de classes, missingness e desenho do split.”

Esses detalhes ajudam o skill a escolher o caminho certo da tarefa e evitam código genérico que não corresponde ao seu experimento.

Workflow que costuma funcionar melhor

Primeiro identifique a tarefa terapêutica, depois confirme a classe do dataset e a política de split, então carregue os dados e inspecione os rótulos antes de modelar. Se você estiver fazendo benchmarking, decida cedo se precisa de um scaffold split, um cold split ou outro setup de avaliação predefinido, porque essa escolha afeta mais a comparabilidade do que a escolha do modelo.

FAQ do skill pytdc

O pytdc é só para modelos de descoberta de fármacos?

Na maior parte, sim. O skill pytdc foi construído em torno de casos de uso de ML terapêutico e farmacologia, especialmente datasets e benchmarks, e não de análise tabular de uso geral. Se o seu projeto não tem relação com compostos, proteínas ou tarefas de interação entre fármacos, provavelmente outro skill será mais adequado.

Preciso já ter experiência com PyTDC para usar o skill?

Não. O skill é útil para iniciantes que consigam descrever o objetivo do dataset em linguagem simples. O mais importante é ser específico sobre a tarefa-alvo, o split desejado e se você precisa de análise, predição ou geração.

Em que isso é diferente de um prompt comum?

Um prompt comum pode descrever etapas pontuais de carregamento ou modelagem, mas o skill pytdc é mais útil quando você quer acesso reproduzível a dados e disciplina de benchmark. Isso é especialmente importante quando você precisa de splits padrão e convenções de avaliação que facilitem a comparação de resultados.

Quando não devo usar o pytdc?

Não use pytdc se você não precisa de datasets do TDC ou de benchmarks terapêuticos, ou se quer apenas uma visão geral de alto nível sobre conceitos de química medicinal. Ele também não é a melhor escolha se seus dados são proprietários e não têm relação com as famílias de tarefas terapêuticas suportadas.

Como melhorar o skill pytdc

Informe a tarefa antes da ideia de modelo

A melhoria mais útil em uma solicitação para pytdc é deixar mais claro o problema. Diga se você precisa de property prediction, DTI, DDI, geração de moléculas ou retrosíntese antes de mencionar arquiteturas ou métricas. Isso permite que o skill escolha o dataset certo e as premissas corretas de pré-processamento.

Especifique expectativas de split e métrica

Muitos erros vêm de uma avaliação mal especificada. Se você se importa com scaffold split, cold split, ROC-AUC, PR-AUC, RMSE ou métricas de ranking, diga isso logo no prompt do pytdc. A saída fica muito melhor quando a estratégia de split e a métrica já estão definidas antes de começar a discussão de modelagem.

Compartilhe suas restrições e o formato dos dados

Se você precisa de código pronto para notebook, de uma auditoria leve dos dados ou de compatibilidade com uma stack específica, inclua isso no pedido. Para pytdc for Data Analysis, diga se quer balanceamento de classes, checagem de valores ausentes, resumo de descritores ou verificação de risco de leakage entre treino e teste, para que a saída foque nos diagnósticos certos.

Itere refinando o alvo do dataset

Se a primeira resposta vier ampla demais, restrinja por família de dataset, tipo de tarefa e formato de saída. Um follow-up melhor poderia ser: “Mantenha o mesmo workflow do pytdc, mas troque para classificação de toxicidade, use um scaffold split e retorne apenas as etapas de carregamento de dados e avaliação.”

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices é uma skill de melhores práticas para ClickHouse voltada para Engenharia de Banco de Dados. Ela orienta o desenho de schema, a otimização de queries, a estratégia de inserts e a conectividade com agentes por meio de recomendações baseadas em regras, deixando o uso de clickhouse-best-practices mais fácil de acionar, revisar e citar em fluxos de trabalho do ClickHouse.

Database Engineering

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

O chdb-datastore é um skill compatível com pandas para análise de dados rápida, com uma API DataStore baseada em ClickHouse. Ele oferece suporte a conectores de arquivos, banco de dados e nuvem, joins entre fontes diferentes e mudanças mínimas de código em fluxos de trabalho no estilo pandas. Use este guia do chdb-datastore quando você quiser uma camada de análise plug-and-play para conjuntos de dados maiores.

Data Analysis

Favoritos 0GitHub 0

sympy

por K-Dense-AI

Use a skill do SymPy para matemática simbólica exata em Python, incluindo álgebra, cálculo, matrizes, fórmulas de física, teoria dos números, geometria e geração de código. Ela ajuda você a manter expressões exatas, escolher os módulos certos do SymPy e evitar erros comuns com floats. É ideal para quem quer um guia prático de SymPy para fluxos simbólicos e para usar SymPy em análise de dados.

Data Analysis

Favoritos 0GitHub 21.4k

interpreting-culture-index

por trailofbits

A skill interpreting-culture-index ajuda a interpretar pesquisas Culture Index, exportações de perfil e notas relacionadas de contratação ou coaching. Use esta skill interpreting-culture-index para avaliar aderência a funções, dinâmica de equipe, risco de burnout, debriefs de candidatos, planos de onboarding e mediação de conflitos. Ela enfatiza leitura relativa das setas, checagem de anti-patterns e entregas práticas para análise de dados e apoio à decisão.

Data Analysis

Favoritos 0GitHub 5k

azure-search-documents-py

por microsoft

azure-search-documents-py é a skill em Python para Azure AI Search voltada a desenvolvimento backend, cobrindo instalação, autenticação, design de índices, busca vetorial, busca híbrida, ranking semântico e recuperação agentic. Use a skill azure-search-documents-py quando precisar de orientação prática, da configuração aos padrões de consulta que realmente funcionam.

Backend Development

Favoritos 0GitHub 2.3k

gget

por K-Dense-AI

gget é uma skill de bioinformática para acesso rápido e unificado a mais de 20 bancos de dados genômicos e ferramentas de análise via CLI ou Python. Use para informações de genes, buscas relacionadas a BLAST, estruturas do AlphaFold, dados de expressão, associações com doenças e análises no estilo enrichment. É uma boa opção para exploração rápida e fluxos de trabalho de análise de dados com gget.

Data Analysis

Favoritos 0GitHub 0

torch-geometric

por K-Dense-AI

Guia do skill torch-geometric para redes neurais gráficas com PyTorch Geometric. Use para ajuda na instalação do torch-geometric, uso do torch-geometric, classificação de grafos, classificação de nós, previsão de links, grafos heterogêneos, camadas customizadas de MessagePassing e escalabilidade de GNNs em fluxos de Machine Learning.

Machine Learning

Favoritos 0GitHub 21.4k

rdkit

por K-Dense-AI

O skill rdkit ajuda em fluxos de trabalho precisos de quimioinformática: análise de SMILES, SDF, MOL, PDB e InChI; cálculo de descritores; geração de fingerprints; busca por subestruturas; tratamento de reações; e criação de coordenadas 2D/3D. Use este guia do rdkit para controle avançado, sanitização personalizada e fluxos de trabalho de rdkit para análise de dados.

Data Analysis

Favoritos 0GitHub 21.4k

huggingface-vision-trainer

por huggingface

A skill huggingface-vision-trainer ajuda você a instalar e usar uma skill do Hugging Face para jobs de treinamento em visão: detecção de objetos, classificação de imagens e segmentação com SAM/SAM2. Cobre preparação de datasets, configuração de GPU na nuvem, avaliação, logging com Trackio e envio dos resultados para o Hub. É ideal para automação de backend e fluxos de treinamento repetíveis.

Backend Development

Favoritos 0GitHub 10.4k

seo-dataforseo

por AgriciDaniel

A skill seo-dataforseo conecta o Claude a dados de SEO em tempo real por meio do servidor MCP da DataForSEO para checagens de SERP, pesquisa de palavras-chave, backlinks, análise on-page, pesquisa de concorrentes, listagens de negócios e monitoramento de visibilidade em IA. É mais indicada para fluxos orientados por dados quando você precisa de evidências reais de busca, instruções claras de instalação e uso prático da seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

pymc

por K-Dense-AI

PyMC é uma skill de modelagem bayesiana para construir, ajustar, verificar e comparar modelos probabilísticos em Python. Use pymc para regressão hierárquica, análise multivariada, séries temporais, dados ausentes, erro de medição e comparação de modelos com LOO ou WAIC.

Data Analysis

Favoritos 0GitHub 0

pymatgen

por K-Dense-AI

pymatgen é um toolkit em Python para ciência dos materiais, voltado a estruturas cristalinas, diagramas de fase, estrutura eletrônica e conversão de arquivos. Esta skill de pymatgen ajuda em fluxos de trabalho científicos com CIF, POSCAR, VASP e dados do Materials Project.

Scientific

Favoritos 0GitHub 0

geopandas

por K-Dense-AI

skill geopandas para análise de dados vetoriais geoespaciais em Python, incluindo arquivos shapefile, GeoJSON e GeoPackage. Use para ler, limpar, fazer joins, criar buffers, recortar, reprojetar e exportar dados espaciais com menos suposições.

Data Analysis

Favoritos 0GitHub 0

analyzing-threat-intelligence-feeds

por mukul975

O analyzing-threat-intelligence-feeds ajuda você a ingerir feeds de CTI, normalizar indicadores, avaliar a qualidade dos feeds e enriquecer IOCs para fluxos de trabalho com STIX 2.1. Este skill analyzing-threat-intelligence-feeds foi criado para operações de threat intel e análise de dados, com orientações práticas para TAXII, MISP e feeds comerciais.

Data Analysis

Favoritos 0GitHub 0

azure-ai-textanalytics-py

por microsoft

azure-ai-textanalytics-py é uma skill para Azure AI Text Analytics em Python. Ela ajuda com análise de sentimento, reconhecimento de entidades, extração de frases-chave, detecção de idioma, detecção de PII e NLP para saúde. Use-a quando precisar de um caminho rápido para configurar o cliente Azure, autenticação e uso prático de análise de texto em apps, notebooks ou fluxos de análise de dados.

Data Analysis

Favoritos 0GitHub 0

chdb-sql

por ClickHouse

chdb-sql é uma skill do GitHub para executar SQL do ClickHouse em Python sem servidor. Ela cobre chdb.query(), Session, conexões DB-API, table functions como file() e s3(), consultas parametrizadas e fluxos de trabalho de desenvolvimento backend para arquivos locais e fontes de dados externas.

Backend Development

Favoritos 0GitHub 0