pytdc

par K-Dense-AI

pytdc est une skill pour Therapeutics Data Commons, qui fournit des jeux de données et des benchmarks prêts pour l’IA pour la découverte de médicaments : ADME, toxicité, DTI, DDI, génération, splits par scaffold et prédiction pharmacologique.

Étoiles0

Favoris0

Commentaires0

Ajouté14 mai 2026

CatégorieData Analysis

Commande d’installation

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

Score éditorial

Cette skill obtient un score de 78/100, ce qui en fait un candidat solide pour les utilisateurs d’un annuaire qui recherchent un workflow PyTDC pratique pour le machine learning en thérapeutique. Le dépôt fournit suffisamment de détails opérationnels pour aider un agent à reconnaître quand l’utiliser, l’installer et gérer les tâches clés liées aux jeux de données et aux benchmarks, avec moins d’incertitude qu’avec une requête générique.

78/100

Points forts

Les cas d’usage explicites couvrent l’ADME, la toxicité, l’interaction médicament-cible, la génération de molécules et l’évaluation sur benchmarks.
Des commandes d’installation et de mise à niveau sont fournies avec un chemin concret via `pip`/`uv`, ce qui améliore le déclenchement et l’adoption.
Un long `SKILL.md` structuré, avec de nombreux titres et sections de workflow, suggère un contenu opérationnel substantiel plutôt qu’un simple placeholder.

Points de vigilance

L’arborescence du dépôt ne montre ni scripts, ni références, ni ressources, ni métadonnées de commande d’installation au-delà de `SKILL.md`, donc certains workflows peuvent dépendre uniquement d’instructions rédigées.
L’extrait indique une couverture large, mais pas ici un démarrage rapide complet de bout en bout ; les utilisateurs peuvent donc encore avoir besoin de tâtonner pour certaines tâches spécifiques.

Python Dataset Benchmarking Machine Learning Drug Discovery Therapeutic

Vue d’ensemble

Aperçu de pytdc

À quoi sert `pytdc`

pytdc est le skill pour utiliser Therapeutics Data Commons dans des workflows de découverte de médicaments pilotés par l’IA. Il vous aide à accéder à des jeux de données et à des benchmarks curés et prêts pour l’IA pour l’ADME, la toxicité, la bioactivité, l’interaction médicament-cible, l’interaction médicament-médicament, la génération et des tâches d’évaluation connexes, sans avoir à inventer votre propre schéma de données.

Qui devrait l’installer

Installez le skill pytdc si vous travaillez sur du machine learning thérapeutique, de la prédiction pharmacologique ou des benchmarks de modèles avec des splits et des métriques standardisés. C’est un très bon choix pour les data scientists qui ont besoin d’un accès reproductible aux jeux de données ; c’est un choix moins pertinent si vous avez seulement besoin d’un prompt générique sur la chimie, sans chargement de données ni étape d’évaluation.

Pourquoi c’est important

La principale valeur du skill pytdc ne se limite pas à l’accès aux données : elle vient aussi du cadre qu’il fournit autour de celles-ci. Chargeurs spécifiques à la tâche, splits standard comme les scaffold splits ou les cold splits, et choix d’évaluation adaptés aux benchmarks réduisent les freins habituels à l’adoption dans la découverte de médicaments, où des prétraitements incohérents et des découpages faits au cas par cas rendent les résultats difficiles à croire.

Comment utiliser le skill pytdc

Installer pytdc dans votre environnement

Commencez par la commande d’installation donnée dans les instructions du skill :
uv pip install PyTDC

Pour mettre à jour une installation existante, utilisez :
uv pip install PyTDC --upgrade

Si votre workflow repose sur un autre gestionnaire de paquets, mappez le même nom de package dans cet environnement plutôt que de réécrire les hypothèses du skill.

Commencer par les bons fichiers

Commencez par SKILL.md, puis lisez les sections sur l’aperçu, quand l’utiliser, l’installation et le démarrage rapide avant de passer au code. Si vous avez besoin d’un contexte projet plus large, inspectez toute documentation voisine exposée par le repo via l’arborescence de fichiers du skill ; dans ce dépôt, le contenu du skill lui-même est la source de vérité principale.

Transformer un objectif flou en prompt exploitable

pytdc usage fonctionne mieux lorsque votre prompt nomme la tâche, la famille de données, la stratégie de split et l’objectif de sortie. Par exemple, au lieu de demander « aide pour PyTDC », demandez :

« Charger un jeu de données ADME dans pytdc, utiliser un scaffold split et préparer un workflow de régression de base. »
« Montrer un pytdc guide pour du benchmarking DTI avec des splits train/validation/test et le reporting des métriques. »
« Mettre en place pytdc for Data Analysis sur un jeu de données de toxicité et résumer l’équilibre des classes, les valeurs manquantes et la conception du split. »

Ces précisions aident le skill à choisir le bon chemin de tâche et à éviter du code générique qui ne correspond pas à votre expérience.

Workflow qui fonctionne le mieux en pratique

Identifiez d’abord la tâche thérapeutique, puis vérifiez la classe du jeu de données et la politique de split, puis chargez les données et inspectez les labels avant de modéliser. Si vous faites du benchmarking, décidez tôt si vous avez besoin d’un scaffold split, d’un cold split ou d’un autre dispositif d’évaluation prédéfini, car ce choix influence davantage la comparabilité des résultats que le choix du modèle.

FAQ sur le skill pytdc

`pytdc` est-il réservé aux modèles de découverte de médicaments ?

Principalement, oui. Le skill pytdc est construit autour des cas d’usage de ML thérapeutique et de pharmacologie, en particulier autour des jeux de données et des benchmarks plutôt que de l’analyse tabulaire généraliste. Si votre projet n’a rien à voir avec les composés, les protéines ou les tâches d’interaction médicamenteuse, un autre skill sera probablement mieux adapté.

Faut-il déjà connaître PyTDC pour utiliser le skill ?

Non. Le skill est utile même aux débutants capables de décrire un objectif de jeu de données en langage courant. L’essentiel est d’être précis sur la tâche visée, le split souhaité et le besoin éventuel d’analyse, de prédiction ou de génération.

En quoi est-ce différent d’un prompt classique ?

Un prompt classique peut décrire une étape ponctuelle de chargement ou de modélisation, mais le skill pytdc devient plus utile quand vous voulez un accès reproductible aux données et une discipline de benchmark. C’est particulièrement important lorsque vous avez besoin de splits standard et de conventions d’évaluation qui rendent les résultats plus faciles à comparer.

Quand ne faut-il pas utiliser pytdc ?

N’utilisez pas pytdc si vous n’avez pas besoin des jeux de données TDC ou des benchmarks thérapeutiques, ou si vous voulez seulement un aperçu général de la chimie médicinale. Ce n’est pas non plus le meilleur choix si vos données sont propriétaires et sans rapport avec les familles de tâches thérapeutiques prises en charge.

Comment améliorer le skill pytdc

Indiquez la tâche avant l’idée de modèle

L’amélioration la plus utile d’une demande pytdc consiste à clarifier le cadrage du problème. Dites si vous avez besoin de prédiction de propriété, de DTI, de DDI, de génération de molécules ou de rétrosynthèse avant de mentionner les architectures ou les métriques. Cela permet au skill de choisir le bon jeu de données et les bonnes hypothèses de prétraitement.

Précisez vos attentes sur les splits et les métriques

Beaucoup d’échecs viennent d’une évaluation trop peu précisée. Si vous tenez à un scaffold split, à un cold split, au ROC-AUC, au PR-AUC, au RMSE ou à des métriques de ranking, dites-le dès le départ dans votre prompt pytdc. Le résultat est bien meilleur lorsque la stratégie de split et la métrique sont fixées avant de commencer la discussion sur la modélisation.

Décrivez vos contraintes et la forme de vos données

Si vous avez besoin d’un code prêt pour notebook, d’un audit léger des données ou d’une compatibilité avec une pile technique précise, incluez-le dans la demande. Pour pytdc for Data Analysis, précisez si vous voulez l’équilibre des classes, des vérifications de valeurs manquantes, des résumés de descripteurs ou des contrôles de risque de fuite entre train et test, afin que la réponse se concentre sur les bons diagnostics.

Itérez en resserrant la cible du jeu de données

Si la première réponse est trop large, recentrez-la par famille de données, type de tâche et format de sortie. Un meilleur suivi pourrait être : « Garde le même workflow pytdc, mais passe à une classification de toxicité, utilise un scaffold split et ne renvoie que les étapes de chargement des données et d’évaluation. »

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

clickhouse-best-practices

par ClickHouse

clickhouse-best-practices est un skill de bonnes pratiques ClickHouse pour l’ingénierie des bases de données. Il guide la conception du schéma, l’optimisation des requêtes, la stratégie d’insertion et la connexion des agents avec des recommandations fondées sur des règles, afin de faciliter le déclenchement, la revue et la citation de l’usage de clickhouse-best-practices dans les workflows ClickHouse.

Database Engineering

Favoris 0GitHub 412

chdb-datastore

par ClickHouse

chdb-datastore est un skill compatible avec pandas pour une analyse de données rapide, avec une API DataStore adossée à ClickHouse. Il prend en charge les connecteurs de fichiers, de bases de données et de cloud, les jointures entre sources, et des changements de code minimes pour des workflows de type pandas. Utilisez ce guide chdb-datastore lorsque vous voulez une couche d’analyse prête à l’emploi pour des jeux de données plus volumineux.

Data Analysis

Favoris 0GitHub 0

sympy

par K-Dense-AI

Utilisez la compétence sympy pour faire des maths symboliques exactes en Python, notamment en algèbre, calcul, matrices, formules de physique, théorie des nombres, géométrie et génération de code. Elle vous aide à conserver des expressions exactes, à choisir les bons modules SymPy et à éviter les erreurs liées aux flottants. C’est un bon choix pour celles et ceux qui cherchent un guide pratique sympy pour des workflows symboliques et sympy pour l’analyse de données.

Data Analysis

Favoris 0GitHub 21.4k

interpreting-culture-index

par trailofbits

interpreting-culture-index aide à interpréter les enquêtes Culture Index, les exports de profils et les notes associées au recrutement ou au coaching. Utilisez ce skill interpreting-culture-index pour évaluer l’adéquation à un poste, la dynamique d’équipe, le risque d’épuisement, les débriefs de candidats, les plans d’onboarding et la médiation de conflits. Il met l’accent sur la lecture relative des flèches, les vérifications d’anti-patterns et des livrables concrets pour l’analyse de données et l’aide à la décision.

Data Analysis

Favoris 0GitHub 5k

azure-search-documents-py

par microsoft

azure-search-documents-py est le skill Python pour Azure AI Search dédié au développement backend, avec la configuration, l’authentification, la conception d’index, la recherche vectorielle, la recherche hybride, le classement sémantique et la récupération agentique. Utilisez le skill azure-search-documents-py lorsque vous avez besoin de conseils pratiques, de la mise en route aux schémas de requête réellement exploitables.

Backend Development

Favoris 0GitHub 2.3k

gget

par K-Dense-AI

gget est une skill de bioinformatique pour accéder rapidement et de façon unifiée à plus de 20 bases de données génomiques et outils d’analyse depuis le CLI ou Python. Utilisez-la pour obtenir des informations sur les gènes, faire des recherches liées à BLAST, consulter des structures AlphaFold, des données d’expression, des associations avec des maladies et des analyses de type enrichment. Elle convient bien à l’exploration rapide et aux workflows d’analyse de données avec gget.

Data Analysis

Favoris 0GitHub 0

torch-geometric

par K-Dense-AI

Guide du skill torch-geometric pour les réseaux de neurones graphiques PyTorch Geometric. Utilisez-le pour l’aide à l’installation de torch-geometric, l’utilisation de torch-geometric, la classification de graphes, la classification de nœuds, la prédiction de liens, les graphes hétérogènes, les couches MessagePassing personnalisées et la mise à l’échelle des GNN dans des workflows de Machine Learning.

Machine Learning

Favoris 0GitHub 21.4k

rdkit

par K-Dense-AI

Le skill RDKit aide à piloter avec précision des workflows de chimioinformatique : analyse de SMILES, SDF, MOL, PDB et InChI ; calcul de descripteurs ; génération d’empreintes ; recherche de sous-structures ; gestion de réactions ; et création de coordonnées 2D/3D. Utilisez ce guide RDKit pour un contrôle avancé, une sanitization personnalisée et des workflows RDKit pour l’analyse de données.

Data Analysis

Favoris 0GitHub 21.4k

huggingface-vision-trainer

par huggingface

huggingface-vision-trainer vous aide à installer et utiliser un skill Hugging Face pour des tâches d’entraînement vision : détection d’objets, classification d’images et segmentation SAM/SAM2. Il couvre la préparation des jeux de données, la configuration de GPU cloud, l’évaluation, la journalisation avec Trackio et l’envoi des résultats sur le Hub. Idéal pour l’automatisation backend et les workflows d’entraînement reproductibles.

Backend Development

Favoris 0GitHub 10.4k

seo-dataforseo

par AgriciDaniel

seo-dataforseo connecte Claude à des données SEO en temps réel via le serveur MCP DataForSEO pour vérifier les SERP, faire de la recherche de mots-clés, analyser les backlinks et les pages, étudier la concurrence, examiner les fiches d’établissement et suivre la visibilité dans les IA. C’est particulièrement adapté aux workflows fondés sur les données quand vous avez besoin de preuves issues des résultats de recherche, d’instructions d’installation claires et d’une utilisation concrète de seo-dataforseo.

Keyword Research

Favoris 0GitHub 6.2k

pymc

par K-Dense-AI

PyMC est un skill de modélisation bayésienne pour construire, ajuster, vérifier et comparer des modèles probabilistes en Python. Utilisez pymc pour la régression hiérarchique, l’analyse multiniveau, les séries temporelles, les données manquantes, l’erreur de mesure et la comparaison de modèles avec LOO ou WAIC.

Data Analysis

Favoris 0GitHub 0

pymatgen

par K-Dense-AI

pymatgen est une boîte à outils Python pour la science des matériaux, dédiée aux structures cristallines, aux diagrammes de phase, à la structure électronique et à la conversion de fichiers. Ce skill pymatgen aide à gérer des workflows scientifiques avec des données CIF, POSCAR, VASP et Materials Project.

Scientific

Favoris 0GitHub 0

geopandas

par K-Dense-AI

Skill geopandas pour l’analyse de données vectorielles géospatiales en Python, y compris les fichiers shapefiles, GeoJSON et GeoPackage. Utilisez-le pour lire, nettoyer, joindre, créer des buffers, découper, reprojeter et exporter des données spatiales avec moins d’hésitation.

Data Analysis

Favoris 0GitHub 0

analyzing-threat-intelligence-feeds

par mukul975

Analyzing-threat-intelligence-feeds vous aide à ingérer des flux CTI, normaliser des indicateurs, évaluer la qualité des flux et enrichir des IOC pour des workflows STIX 2.1. Ce skill analyzing-threat-intelligence-feeds est conçu pour les opérations de renseignement sur les menaces et l’analyse de données, avec des conseils pratiques pour TAXII, MISP et les flux commerciaux.

Data Analysis

Favoris 0GitHub 0

azure-ai-textanalytics-py

par microsoft

azure-ai-textanalytics-py est un skill pour Azure AI Text Analytics en Python. Il aide pour l’analyse de sentiment, la reconnaissance d’entités, l’extraction de phrases clés, la détection de langue, la détection de PII et le NLP pour la santé. Utilisez-le si vous cherchez un moyen rapide de configurer un client Azure, de gérer l’authentification et d’exploiter concrètement l’analyse de texte dans des applications, des notebooks ou des flux d’analyse de données.

Data Analysis

Favoris 0GitHub 0

chdb-sql

par ClickHouse

chdb-sql est un skill GitHub pour exécuter du SQL ClickHouse dans Python, sans serveur. Il couvre `chdb.query()`, `Session`, les connexions DB-API, des fonctions de table comme `file()` et `s3()`, les requêtes paramétrées, ainsi que des workflows de développement backend pour les fichiers locaux et les sources de données externes.

Backend Development

Favoris 0GitHub 0

pytdc

Aperçu de pytdc

À quoi sert pytdc

Qui devrait l’installer

Pourquoi c’est important

Comment utiliser le skill pytdc

Installer pytdc dans votre environnement

Commencer par les bons fichiers

Transformer un objectif flou en prompt exploitable

Workflow qui fonctionne le mieux en pratique

FAQ sur le skill pytdc

pytdc est-il réservé aux modèles de découverte de médicaments ?

Faut-il déjà connaître PyTDC pour utiliser le skill ?

En quoi est-ce différent d’un prompt classique ?

Quand ne faut-il pas utiliser pytdc ?

Comment améliorer le skill pytdc

Indiquez la tâche avant l’idée de modèle

Précisez vos attentes sur les splits et les métriques

Décrivez vos contraintes et la forme de vos données

Itérez en resserrant la cible du jeu de données

Notes et avis

À quoi sert `pytdc`

`pytdc` est-il réservé aux modèles de découverte de médicaments ?