pytdc

作成者 K-Dense-AI

pytdc は Therapeutics Data Commons 向けのスキルで、ADME、毒性、DTI、DDI、生成、scaffold split、薬理予測のための、AIでそのまま扱いやすい創薬データセットとベンチマークを提供します。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

編集スコア

このスキルは 78/100 点で、実務的な PyTDC ワークフローを求めるディレクトリ利用者にとって十分有力な掲載候補です。リポジトリには、いつ使うべきか、どう導入するか、主要なデータセット/ベンチマーク作業をどう進めるかをエージェントが判断するのに必要な運用情報があり、汎用的なプロンプトよりも迷いを減らせます。

78/100

強み

ADME、毒性、薬物-標的相互作用、分子生成、ベンチマーク評価まで、想定ユースケースが明確に示されています。
インストールとアップグレードのコマンドが `pip`/`uv` の具体的な手順つきで提示されており、起動条件を見つけやすく導入しやすいです。
見出しとワークフロー節が多い構造化された長めの `SKILL.md` で、単なるプレースホルダーではなく実用的な運用ガイドであることがうかがえます。

注意点

リポジトリツリーには `SKILL.md` 以外の scripts、references、resources、install command metadata が見当たらないため、一部のワークフローは文章ベースの手順に依存する可能性があります。
抜粋からは広い対応範囲は分かるものの、ここではエンドツーエンドのクイックスタートが完全には見えていないため、特定タスクでは多少の試行錯誤が必要かもしれません。

Python Dataset Benchmarking Machine Learning Drug Discovery Therapeutic

概要

pytdc スキルの概要

pytdc は何のためのものか

pytdc は、AI を活用した創薬ワークフローで Therapeutics Data Commons を使うためのスキルです。ADME、毒性、生物活性、drug-target interaction、drug-drug interaction、生成、その他の評価タスク向けに、独自のデータスキーマを作らずに、整理済みで AI 向けに整えられたデータセットやベンチマークへアクセスできます。

どんな人がインストールすべきか

標準化された split や指標で therapeutic ML、薬理予測、モデルベンチマークを行うなら、pytdc スキルをインストールしてください。再現性のあるデータセットアクセスが必要なデータサイエンティストには特に向いています。一方で、データの読み込みや評価ステップが不要で、単に汎用的な化学プロンプトだけ欲しい場合は、適合度は低めです。

なぜ重要なのか

pytdc スキルの価値は、単なるデータセットアクセスにとどまりません。タスク別ローダー、scaffold split や cold split のような標準 split、ベンチマークに使いやすい評価選択肢まで含めて構造化されている点が重要です。創薬では前処理のばらつきや場当たり的な split が結果の信頼性を下げがちですが、pytdc はその導入障壁を下げてくれます。

pytdc スキルの使い方

環境に pytdc をインストールする

まずはスキルの指示にあるインストールコマンドを使います:
uv pip install PyTDC

既存の環境を更新する場合は、次を使います:
uv pip install PyTDC --upgrade

別のパッケージマネージャーを使うワークフローでも、スキルの前提を変えてしまうのではなく、同じパッケージ名をその環境に対応づけてください。

まず適切なファイルから読む

まず SKILL.md を開き、そのあとで overview、when to use、installation、quick start の各セクションを読んでからコードに進んでください。より広いプロジェクト文脈が必要なら、repo がスキルの file tree で公開している近接ドキュメントも確認します。この repository では、スキル本体の内容が主な正本です。

曖昧な目的を実用的なプロンプトに変える

pytdc usage は、タスク、データセット系統、split 戦略、出力目標を明示したプロンプトで最も効果を発揮します。たとえば「PyTDC を手伝って」ではなく、次のように依頼するとよいです。

「pytdc で ADME データセットを読み込み、scaffold split を使って、ベースライン回帰ワークフローを準備して。」
「train/validation/test split と metric reporting を含む DTI benchmarking 用の pytdc guide を示して。」
「毒性データセットで pytdc for Data Analysis を設定し、label balance、missingness、split design を要約して。」

こうした情報があると、スキルは適切なタスク経路を選びやすくなり、実験に合わない汎用コードを避けられます。

うまくいきやすいワークフロー

まず therapeutic task を特定し、次に dataset class と split policy を確認し、その後でデータを読み込んで、モデリング前にラベルを点検します。ベンチマーク用途なら、scaffold split、cold split、あるいは別の predefined evaluation setup が必要かを早めに決めてください。モデル選択よりも、その判断のほうが比較可能性に強く影響します。

pytdc スキルのよくある質問

pytdc は創薬モデル専用ですか？

概ねその通りです。pytdc スキルは、一般的な表形式分析よりも、データセットやベンチマークを中心とした therapeutic ML と pharmacology の用途向けに作られています。化合物、タンパク質、drug interaction に関係しないプロジェクトなら、別のスキルのほうが適している可能性が高いです。

スキルを使う前に PyTDC の経験は必要ですか？

いいえ。平易な言葉でデータセットの目的を説明できるなら、初心者にも役立ちます。大切なのは、対象タスク、必要な split、そして analysis、prediction、generation のどれが必要かを具体的に伝えることです。

通常のプロンプトと何が違いますか？

通常のプロンプトでも、個別の読み込みやモデリング手順は説明できます。ただし、pytdc スキルは、再現可能なデータアクセスとベンチマークの厳密さが必要なときにより有効です。特に、結果の比較をしやすくするための標準 split や評価慣行が必要な場合に重要になります。

どんなときに pytdc を使うべきではありませんか？

TDC のデータセットや therapeutic ベンチマークが不要な場合、あるいは medicinal chemistry の概念を高レベルで知りたいだけなら、pytdc は使わないでください。対象データが proprietary で、かつ対応している therapeutic task family に関係しない場合も、最適な選択ではありません。

pytdc スキルをどう改善するか

まずモデル案ではなくタスクを示す

pytdc への依頼で最も効く改善は、問題設定をより明確にすることです。architecture や metric に触れる前に、property prediction、DTI、DDI、molecule generation、retrosynthesis のどれが必要かを伝えてください。そうすれば、スキルは適切な dataset と preprocessing の前提を選びやすくなります。

split と metric の期待値を明記する

失敗の多くは、評価条件が曖昧なことから起こります。scaffold split、cold split、ROC-AUC、PR-AUC、RMSE、ranking metrics にこだわりがあるなら、pytdc プロンプトの最初に明示してください。split 戦略と metric が modeling の話に入る前に固定されているほど、出力は良くなります。

制約とデータの形を共有する

notebook ですぐ使えるコードが必要か、軽量な data audit で十分か、特定の stack との互換性が必要かを、依頼文に含めてください。pytdc for Data Analysis では、class balance、missing-value checks、descriptor summaries、train/test leakage risk checks のどれが欲しいのかを伝えると、出力が適切な診断に集中します。

データセットの対象を絞って反復する

最初の回答が広すぎるなら、データセット系統、タスク種別、出力形式で絞り込んでください。たとえば、次のように聞き直すとよいです。「同じ pytdc ワークフローを保ったまま、toxicity classification に切り替え、scaffold split を使い、data-loading と evaluation steps だけ返して。」

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0