pytdc

von K-Dense-AI

pytdc ist eine Skill für Therapeutics Data Commons und stellt KI-taugliche Datensätze und Benchmarks für Drug Discovery bereit, darunter ADME, Toxizität, DTI, DDI, Generierung, Scaffold-Splits und pharmakologische Vorhersagen.

Stars0

Favoriten0

Kommentare0

Hinzugefügt14. Mai 2026

KategorieData Analysis

Installationsbefehl

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

Kurationswert

Diese Skill erreicht 78/100 und ist damit ein solider Kandidat für ein Verzeichnis, wenn Nutzer einen praxisnahen PyTDC-Workflow für therapeutisches ML brauchen. Das Repository liefert genug operative Details, damit ein Agent besser erkennt, wann man es einsetzen sollte, wie die Installation funktioniert und wie zentrale Dataset- und Benchmark-Aufgaben mit weniger Rätselraten als bei einem generischen Prompt bearbeitet werden.

78/100

Stärken

Klare Anwendungsfälle für ADME, Toxizität, Drug-Target-Interaction, Molekülgenerierung und Benchmark-Bewertung.
Installations- und Upgrade-Befehle sind mit einem konkreten pip/uv-Pfad angegeben, was die Erkennbarkeit und Übernahme verbessert.
Die lange, strukturierte SKILL.md mit vielen Überschriften und Workflow-Abschnitten deutet auf substanziellen operativen Leitfaden statt Platzhalter hin.

Hinweise

Die Repository-Struktur zeigt keine Scripts, References, Resources oder Metadaten zu Installationsbefehlen jenseits von SKILL.md, daher können manche Workflows nur auf narrativen Anweisungen beruhen.
Der Ausschnitt deutet auf eine breite Abdeckung hin, zeigt hier aber keinen vollständig sichtbaren End-to-End-Quickstart, sodass bei bestimmten Aufgaben weiterhin etwas Ausprobieren nötig sein kann.

Python Dataset Benchmarking Machine Learning Drug Discovery Therapeutic

Überblick

Übersicht über den `pytdc`-Skill

Wofür `pytdc` gedacht ist

pytdc ist der Skill für die Arbeit mit Therapeutics Data Commons in KI-gestützten Drug-Discovery-Workflows. Er hilft dir dabei, kuratierte, KI-taugliche Datensätze und Benchmarks für ADME, Toxizität, Bioaktivität, Drug-Target-Interaktion, Drug-Drug-Interaktion, Generierung und verwandte Auswertungsaufgaben zu nutzen, ohne dein eigenes Datenschema erfinden zu müssen.

Wer ihn installieren sollte

Installiere den pytdc-Skill, wenn du therapeutisches ML, pharmakologische Vorhersagen oder Modell-Benchmarks auf standardisierten Splits und Metriken durchführst. Er passt besonders gut zu Data Scientists, die reproduzierbaren Zugriff auf Datensätze brauchen; weniger passend ist er, wenn du nur einen generischen Chemistry-Prompt ohne Datenladen oder Evaluierung brauchst.

Warum das relevant ist

Der eigentliche Mehrwert des pytdc-Skills liegt nicht nur im Zugriff auf Datensätze, sondern in der Struktur darum herum: task-spezifische Loader, Standard-Splits wie Scaffold- oder Cold-Splits und benchmark-taugliche Evaluationsoptionen. Das reduziert typische Hürden in der Drug-Discovery-Arbeit, wo inkonsistente Vorverarbeitung und ad-hoc Splits Ergebnisse schwer überprüfbar machen können.

So verwendest du den `pytdc`-Skill

`pytdc` in deiner Umgebung installieren

Nutze zuerst den Installationsbefehl aus der Skill-Anleitung:
uv pip install PyTDC

Für ein bestehendes Setup verwende:
uv pip install PyTDC --upgrade

Wenn dein Workflow einen anderen Paketmanager nutzt, übertrage denselben Paketnamen in diese Umgebung, statt die Annahmen des Skills umzuschreiben.

Mit den richtigen Dateien anfangen

Beginne mit SKILL.md und lies dann die Abschnitte zu Übersicht, Einsatzbereich, Installation und Quick Start, bevor du in den Code gehst. Wenn du breiteren Projektkontext brauchst, prüfe die benachbarte Dokumentation, die das Repo über den Skill-Dateibaum bereitstellt; in diesem Repository ist der Skill-Inhalt selbst die wichtigste Quelle.

Aus einem groben Ziel einen nutzbaren Prompt machen

pytdc usage funktioniert am besten, wenn dein Prompt Task, Datensatzfamilie, Split-Strategie und Ausgabeziel nennt. Statt nur nach „Hilfe mit PyTDC“ zu fragen, formuliere lieber zum Beispiel:

„Lade einen ADME-Datensatz in pytdc, verwende einen Scaffold-Split und bereite einen Baseline-Regression-Workflow vor.“
„Zeige einen pytdc guide für DTI-Benchmarking mit Train/Validation/Test-Splits und Metrik-Reporting.“
„Richte pytdc for Data Analysis auf einem Toxizitätsdatensatz ein und fasse Label-Verteilung, Missingness und das Split-Design zusammen.“

Diese Details helfen dem Skill, den richtigen Task-Pfad zu wählen und generischen Code zu vermeiden, der nicht zu deinem Experiment passt.

Workflow, der meist am besten funktioniert

Identifiziere zuerst die therapeutische Aufgabe, bestätige dann die Datensatzklasse und die Split-Policy, lade anschließend die Daten und prüfe die Labels, bevor du mit dem Modellieren beginnst. Wenn du benchmarkst, entscheide früh, ob du einen Scaffold-Split, einen Cold-Split oder ein anderes vordefiniertes Evaluationssetup brauchst, denn diese Entscheidung beeinflusst die Vergleichbarkeit stärker als die Modellwahl.

FAQ zum `pytdc`-Skill

Ist `pytdc` nur für Drug-Discovery-Modelle?

Meistens ja. Der pytdc-Skill ist auf therapeutische ML- und Pharmakologie-Use-Cases ausgerichtet, vor allem auf Datensätze und Benchmarks statt auf allgemeine tabellarische Analysen. Wenn dein Projekt nichts mit Verbindungen, Proteinen oder Drug-Interaktionsaufgaben zu tun hat, ist ein anderer Skill wahrscheinlich die bessere Wahl.

Muss ich PyTDC bereits kennen, bevor ich den Skill nutze?

Nein. Der Skill ist auch für Einsteiger nützlich, die ihr Datensatz-Ziel in klarer Sprache beschreiben können. Am wichtigsten ist, dass du die Zielaufgabe, den gewünschten Split und den Bedarf an Analyse, Vorhersage oder Generierung konkret benennst.

Worin unterscheidet sich das von einem normalen Prompt?

Ein normaler Prompt kann einzelne Lade- oder Modellierungsschritte beschreiben, aber der pytdc-Skill ist nützlicher, wenn du wiederholbaren Datenzugriff und Benchmark-Disziplin brauchst. Das ist besonders wichtig, wenn du Standard-Splits und Evaluationskonventionen brauchst, die Ergebnisse einfacher vergleichbar machen.

Wann sollte ich `pytdc` nicht verwenden?

Verwende pytdc nicht, wenn du keine TDC-Datensätze oder therapeutischen Benchmarks brauchst oder wenn du nur einen oberflächlichen Überblick über Konzepte der medizinischen Chemie möchtest. Es ist auch nicht die beste Wahl, wenn deine Daten proprietär sind und nicht zu den unterstützten therapeutischen Task-Familien gehören.

So verbesserst du den `pytdc`-Skill

Nenne zuerst die Aufgabe, nicht das Modell

Die nützlichste Verbesserung für eine pytdc-Anfrage ist eine klarere Problemformulierung. Sag zuerst, ob du Property Prediction, DTI, DDI, Molekülgenerierung oder Retrosynthese brauchst, und nenne danach erst Architekturen oder Metriken. So kann der Skill den passenden Datensatz und die richtigen Vorverarbeitungsannahmen wählen.

Split- und Metrik-Erwartungen explizit machen

Viele Fehler entstehen durch unpräzise Evaluation. Wenn dir ein Scaffold-Split, ein Cold-Split, ROC-AUC, PR-AUC, RMSE oder Ranking-Metriken wichtig sind, sag das im pytdc-Prompt direkt dazu. Die Ausgabe wird deutlich besser, wenn Split-Strategie und Metrik feststehen, bevor die Modellierungsdiskussion beginnt.

Deine Constraints und die Datenform mitgeben

Wenn du notebook-tauglichen Code, einen schlanken Daten-Check oder Kompatibilität mit einem bestimmten Stack brauchst, erwähne das in der Anfrage. Für pytdc for Data Analysis solltest du angeben, ob du Klassenbalance, Missing-Value-Prüfungen, Descriptor-Zusammenfassungen oder Checks auf Train/Test-Leakage-Risiken möchtest, damit die Ausgabe auf die richtigen Diagnosen fokussiert.

Durch gezielteres Eingrenzen des Datensatzes iterieren

Wenn die erste Antwort zu breit ist, schränke sie nach Datensatzfamilie, Aufgabentyp und Ausgabeformat ein. Eine bessere Anschlussfrage wäre zum Beispiel: „Behalte denselben pytdc-Workflow bei, wechsle aber zu Toxizitätsklassifikation, verwende einen Scaffold-Split und gib nur die Schritte für Datenladen und Evaluierung zurück.“

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

chdb-datastore

von ClickHouse

chdb-datastore ist ein pandas-kompatibles Skill für schnelle Datenanalyse mit einer von ClickHouse gestützten DataStore-API. Es unterstützt Connectoren für Dateien, Datenbanken und Cloud-Dienste, Cross-Source-Joins und minimale Codeänderungen für pandas-ähnliche Workflows. Nutzen Sie diesen chdb-datastore-Leitfaden, wenn Sie eine Drop-in-Analyseschicht für größere Datensätze suchen.

Data Analysis

Favoriten 0GitHub 0

sympy

von K-Dense-AI

Nutze die sympy-Skill für exakte symbolische Mathematik in Python, einschließlich Algebra, Analysis, Matrizen, physikalischer Formeln, Zahlentheorie, Geometrie und Codegenerierung. Sie hilft dir, Ausdrücke exakt zu halten, die passenden SymPy-Module auszuwählen und typische Fehler durch zu viel Fließkommaarithmetik zu vermeiden. Besonders geeignet für alle, die einen praktischen sympy-Leitfaden für symbolische Workflows und sympy für Data Analysis suchen.

Data Analysis

Favoriten 0GitHub 21.4k

interpreting-culture-index

von trailofbits

interpreting-culture-index hilft dabei, Culture-Index-Umfragen, Profil-Exporte und verwandte Notizen zu Recruiting oder Coaching zu interpretieren. Nutzen Sie dieses interpreting-culture-index Skill für die Eignung für Rollen, Teamdynamiken, Burnout-Risiken, Kandidaten-Feedbackgespräche, Onboarding-Pläne und Konfliktmediation. Der Fokus liegt auf der relativen Auswertung von Pfeilen, dem Prüfen von Anti-Patterns und praxisnahen Ergebnissen für Datenanalyse und Entscheidungsunterstützung.

Data Analysis

Favoriten 0GitHub 5k

azure-search-documents-py

von microsoft

azure-search-documents-py ist der Python-Skill für Azure AI Search im Backend-Umfeld und deckt Installation, Authentifizierung, Indexdesign, Vektorsuche, hybride Suche, semantisches Ranking und agentisches Retrieval ab. Nutzen Sie den azure-search-documents-py Skill, wenn Sie praxisnahe Orientierung vom Setup bis zu funktionierenden Query-Mustern benötigen.

Backend Development

Favoriten 0GitHub 2.3k

gget

von K-Dense-AI

gget ist eine Bioinformatik-Skill für den schnellen, einheitlichen Zugriff auf mehr als 20 genomische Datenbanken und Analysewerkzeuge über CLI oder Python. Nutzen Sie ihn für Geninformationen, BLAST-nahe Abfragen, AlphaFold-Strukturen, Expressionsdaten, Krankheitsassoziationen und Analysen im Stil von Enrichment-Workflows. Er eignet sich für schnelle Exploration und für gget in Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 0

torch-geometric

von K-Dense-AI

torch-geometric Skill-Guide für PyTorch Geometric Graph Neural Networks. Nutzen Sie ihn für Hilfe bei der Installation von torch-geometric, zur Anwendung von torch-geometric, für Graphklassifikation, Node-Klassifikation, Link Prediction, heterogene Graphen, benutzerdefinierte MessagePassing-Layer und das Skalieren von GNNs in Machine-Learning-Workflows.

Machine Learning

Favoriten 0GitHub 21.4k

rdkit

von K-Dense-AI

Die rdkit-Skill unterstützt präzise Cheminformatik-Workflows: SMILES, SDF, MOL, PDB und InChI parsen, Deskriptoren berechnen, Fingerprints erzeugen, Substruktursuche ausführen, Reaktionen handhaben und 2D-/3D-Koordinaten erstellen. Verwenden Sie diesen rdkit-Leitfaden für erweiterte Kontrolle, benutzerdefinierte Sanitization und rdkit für Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 21.4k

huggingface-vision-trainer

von huggingface

huggingface-vision-trainer hilft dir bei der Installation und Nutzung eines Hugging Face Skills für Vision-Trainingsjobs: Objekterkennung, Bildklassifikation und SAM/SAM2-Segmentierung. Abgedeckt werden Dataset-Vorbereitung, Cloud-GPU-Setup, Evaluation, Trackio-Logging und das Hochladen der Ergebnisse zum Hub. Ideal für Backend-Automatisierung und wiederholbare Trainings-Workflows.

Backend Development

Favoriten 0GitHub 10.4k

seo-dataforseo

von AgriciDaniel

seo-dataforseo verbindet Claude über den DataForSEO MCP-Server mit Live-SEO-Daten für SERP-Checks, Keyword-Recherche, Backlinks, Onpage-Analyse, Wettbewerbsrecherche, Business-Listings und AI-Visibility-Tracking. Am besten geeignet für datenbasierte Workflows, wenn Sie echte Suchbelege, klare Installationshinweise und praxisnahe Nutzung von seo-dataforseo brauchen.

Keyword Research

Favoriten 0GitHub 6.2k

pymc

von K-Dense-AI

PyMC ist ein Skill für Bayes-Modellierung zum Erstellen, Anpassen, Prüfen und Vergleichen probabilistischer Modelle in Python. Verwenden Sie pymc für hierarchische Regression, Mehrebenenanalyse, Zeitreihen, fehlende Daten, Messfehler und Modellvergleich mit LOO oder WAIC.

Data Analysis

Favoriten 0GitHub 0

pymatgen

von K-Dense-AI

pymatgen ist ein Python-Toolkit für Materialwissenschaften für Kristallstrukturen, Phasendiagramme, elektronische Struktur und Dateikonvertierung. Diese pymatgen-Skill hilft bei wissenschaftlichen Workflows mit CIF, POSCAR, VASP und Daten aus dem Materials Project.

Scientific

Favoriten 0GitHub 0

geopandas

von K-Dense-AI

geopandas-Skill für die georäumliche Analyse von Vektordaten in Python, inklusive Shapefiles, GeoJSON- und GeoPackage-Dateien. Damit können Sie räumliche Daten lesen, bereinigen, zusammenführen, puffern, zuschneiden, reprojizieren und exportieren – mit weniger Rätselraten.

Data Analysis

Favoriten 0GitHub 0

analyzing-threat-intelligence-feeds

von mukul975

analyzing-threat-intelligence-feeds hilft dir dabei, CTI-Feeds einzulesen, Indicators zu normalisieren, die Feed-Qualität zu bewerten und IOCs für STIX 2.1-Workflows anzureichern. Dieses analyzing-threat-intelligence-feeds Skill ist für Threat-Intelligence-Operations und Data Analysis ausgelegt und bietet praxisnahe Hinweise für TAXII, MISP und kommerzielle Feeds.

Data Analysis

Favoriten 0GitHub 0

azure-ai-textanalytics-py

von microsoft

azure-ai-textanalytics-py ist ein Skill für Azure AI Text Analytics in Python. Er hilft bei Sentimentanalyse, Entitätserkennung, Extraktion von Schlüsselphrasen, Spracherkennung, PII-Erkennung und Healthcare-NLP. Nutzen Sie ihn, wenn Sie einen schnellen Weg zur Einrichtung des Azure-Clients, zur Authentifizierung und zur praxisnahen Nutzung von Text Analytics für Apps, Notebooks oder Data-Analysis-Workflows brauchen.

Data Analysis

Favoriten 0GitHub 0

chdb-sql

von ClickHouse

chdb-sql ist ein GitHub-Skill, mit dem sich ClickHouse SQL in Python ohne Server ausführen lässt. Abgedeckt werden chdb.query(), Session, DB-API-Verbindungen, Table Functions wie file() und s3(), parametrische Abfragen sowie Entwicklungs-Workflows für lokale Dateien und externe Datenquellen.

Backend Development

Favoriten 0GitHub 0

pytdc

Übersicht über den pytdc-Skill

Wofür pytdc gedacht ist

Wer ihn installieren sollte

Warum das relevant ist

So verwendest du den pytdc-Skill

pytdc in deiner Umgebung installieren

Mit den richtigen Dateien anfangen

Aus einem groben Ziel einen nutzbaren Prompt machen

Workflow, der meist am besten funktioniert

FAQ zum pytdc-Skill

Ist pytdc nur für Drug-Discovery-Modelle?

Muss ich PyTDC bereits kennen, bevor ich den Skill nutze?

Worin unterscheidet sich das von einem normalen Prompt?

Wann sollte ich pytdc nicht verwenden?

So verbesserst du den pytdc-Skill

Nenne zuerst die Aufgabe, nicht das Modell

Split- und Metrik-Erwartungen explizit machen

Deine Constraints und die Datenform mitgeben

Durch gezielteres Eingrenzen des Datensatzes iterieren

Bewertungen & Rezensionen

Übersicht über den `pytdc`-Skill

Wofür `pytdc` gedacht ist

So verwendest du den `pytdc`-Skill

`pytdc` in deiner Umgebung installieren

FAQ zum `pytdc`-Skill

Ist `pytdc` nur für Drug-Discovery-Modelle?

Wann sollte ich `pytdc` nicht verwenden?

So verbesserst du den `pytdc`-Skill