pytdc

作者 K-Dense-AI

pytdc 是一個支援 Therapeutics Data Commons 的技能，提供可直接供 AI 使用的藥物發現資料集與基準，涵蓋 ADME、毒性、DTI、DDI、生成、scaffold 切分，以及藥理預測。

Stars0

評論0

加入時間2026年5月14日

分類数据分析

安裝指令

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

編輯評分

這個技能評分為 78/100，代表它是適合目錄使用者的紮實候選項，尤其適合需要實用 PyTDC 工作流程來處理 therapeutics 機器學習的人。這個儲存庫提供足夠的操作細節，能幫助代理判斷何時使用、如何安裝，以及如何處理關鍵資料集與基準任務，較不需要像面對一般提示詞時那麼多猜測。

78/100

亮點

明確的使用情境涵蓋 ADME、毒性、藥物-標的互動、分子生成與基準評估。
提供安裝與升級命令，並包含具體的 pip/uv 路徑，有助於觸發與導入。
篇幅長且結構完整的 SKILL.md，含多個標題與工作流程段落，顯示內容是實質操作指引，而非占位文件。

注意事項

儲存庫樹狀結構中除了 SKILL.md 外，看不到 scripts、references、resources 或 install command metadata，因此某些工作流程可能只能依賴敘述式說明。
摘錄內容顯示涵蓋面很廣，但這裡未完整呈現端到端的快速開始，因此使用者在特定任務上仍可能需要一些試錯。

Python 数据集基准测试 Machine Learning 药物发现治疗

總覽

pytdc 技能概覽

pytdc 是做什麼的

pytdc 是用來在 AI 驅動的藥物發現工作流程中使用 Therapeutics Data Commons 的技能。它能幫你取得經過整理、可直接供 AI 使用的資料集與基準，用於 ADME、毒性、生物活性、drug-target interaction、drug-drug interaction、生成，以及相關評估任務，而不必自己硬生生設計資料結構。

適合誰安裝

如果你在做 therapeutic ML、藥理預測，或是在標準化切分與指標下做模型基準測試，建議安裝 pytdc 技能。對需要可重現資料存取的資料科學家來說，它非常合適；但如果你只需要一個泛用的化學提示，完全不涉及資料載入或評估流程，那它就沒那麼適合。

為什麼它重要

pytdc 技能的核心價值不只是資料集存取，而是它周邊那套結構：針對任務的 loader、像 scaffold 或 cold split 這類標準切分，以及對基準測試友善的評估選項。這能降低藥物發現工作裡常見的導入障礙，因為不一致的前處理與臨時切分方式，常常會讓結果難以信任。

如何使用 pytdc 技能

在你的環境中安裝 pytdc

先使用技能說明中的安裝指令：
uv pip install PyTDC

如果要更新既有環境，使用：
uv pip install PyTDC --upgrade

如果你的工作流程使用的是不同的套件管理工具，就把相同的套件名稱映射到那個環境裡，不要改寫這個技能原本的假設。

先從對的檔案開始看

先從 SKILL.md 開始，接著在直接進入程式碼前，閱讀 overview、when to use、installation、quick start 這幾段。如果你需要更廣的專案脈絡，可以再檢查 repo 透過技能檔案樹提供的鄰近文件；在這個 repository 裡，技能內容本身就是主要的可信來源。

把模糊目標變成可用的提示

pytdc usage 在你的提示詞明確寫出任務、資料集家族、切分策略與輸出目標時，效果最好。比起只說「幫我用 PyTDC」，更好的問法例如：

「在 pytdc 中載入一個 ADME 資料集，使用 scaffold split，並準備一個基準 regression workflow。」
「示範一個用於 DTI benchmarking 的 pytdc guide，包含 train/validation/test split 與 metric reporting。」
「針對毒性資料集設定 pytdc for Data Analysis，並摘要 label balance、missingness 與 split design。」

這些細節能幫技能選到正確的任務路徑，避免產生與你的實驗不相符的泛用程式碼。

通常最有效的工作流程

先辨識 therapeutic task，再確認 dataset class 與 split policy，接著載入資料並在建模前檢查標籤。如果你是在做 benchmarking，應該及早決定要用 scaffold split、cold split，或其他預先定義好的評估設定，因為這個選擇對可比性造成的影響，往往比模型本身還大。

pytdc 技能 FAQ

pytdc 只適用於藥物發現模型嗎？

大致上是。pytdc 技能是圍繞 therapeutic ML 與藥理用途設計的，尤其偏向資料集與基準測試，而不是通用的表格分析。如果你的專案跟化合物、蛋白質或藥物交互作用任務無關，通常會有其他技能更適合。

使用這個技能前一定要先懂 PyTDC 嗎？

不用。這個技能對能用自然語言描述資料集目標的初學者也很有幫助。最重要的是把目標任務、想要的 split，以及你要做的是分析、預測還是生成，講得夠清楚。

這跟一般提示詞有什麼不同？

一般提示詞可以描述一次性的載入或建模步驟，但當你需要可重複的資料存取與 benchmark 規範時，pytdc 技能會更有用。特別是在你需要標準切分與評估慣例、讓結果更容易比較時，這點尤其重要。

什麼情況下不該用 pytdc？

如果你不需要 TDC 資料集或 therapeutic benchmarks，就不要用 pytdc；或者你只想看 medicinal chemistry 的高層次概念概覽，也不適合。若你的資料是專有資料，而且跟支援的 therapeutic task families 無關，這也不是最佳選擇。

如何改進 pytdc 技能

先講任務，再講模型想法

對 pytdc 來說，最有幫助的改進，是把問題框架講得更清楚。先說你需要 property prediction、DTI、DDI、molecule generation，還是 retrosynthesis，再提 architecture 或 metrics。這樣技能才能選對資料集與前處理假設。

明確指定切分與指標期待

很多失敗都來自評估條件不夠具體。如果你在意 scaffold split、cold split、ROC-AUC、PR-AUC、RMSE，或 ranking metrics，請在 pytdc 提示詞一開始就說清楚。當 split strategy 和 metric 在建模討論開始前就固定下來，輸出通常會好很多。

交代你的限制與資料形狀

如果你需要能直接放進 notebook 的程式碼、輕量級的資料稽核，或要和特定技術堆疊相容，請把這些條件一起寫進請求裡。若是 pytdc for Data Analysis，也要說明你想看 class balance、missing-value checks、descriptor summaries，還是 train/test leakage risk checks，這樣輸出才會聚焦在正確的診斷項目上。

透過收斂資料集目標來反覆修正

如果第一次的回答太廣，就用資料集家族、任務類型與輸出格式把範圍收窄。更好的後續追問可以是：「沿用同一個 pytdc workflow，但改成 toxicity classification，使用 scaffold split，並只回傳資料載入與評估步驟。」

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一個相容 pandas 的技能，透過 ClickHouse 支援的 DataStore API 提供快速資料分析。它支援檔案、資料庫與雲端連接器、跨來源 JOIN，以及只需極少程式碼變更的 pandas 風格工作流程。當你需要一個可直接替換、用於較大資料集的分析層時，可以使用這份 chdb-datastore 指南。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中進行精確的符號數學運算，涵蓋代數、微積分、矩陣、物理公式、數論、幾何與程式碼生成。它能幫助你維持表達式的精確性、選對 SymPy 模組，並避免過度依賴浮點數造成的錯誤。最適合需要實用 sympy 指南來處理符號工作流程，以及在 Data Analysis 中使用 sympy 的使用者。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可協助解讀 Culture Index 問卷、個人檔案匯出內容，以及相關的招募或教練筆記。這個 interpreting-culture-index 技能適合用於職務適配、團隊動態、倦怠風險、候選人回饋簡報、入職規劃與衝突調解。它強調依箭頭相對位置來閱讀、檢查反模式，以及產出實用的分析結果，支援資料分析與決策判斷。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是 Python 版的 Azure AI Search 技能，適合後端開發，涵蓋安裝、驗證、索引設計、向量搜尋、混合搜尋、語意排序與 agentic retrieval。當你需要從環境設定一路到可運作的查詢模式的實作指引時，適合使用 azure-search-documents-py 技能。

後端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一個生物資訊技能，可透過 CLI 或 Python 快速、統一地存取 20+ 個基因組資料庫與分析工具。適合查詢基因資訊、BLAST 相關資料、AlphaFold 結構、表現量資料、疾病關聯，以及進行類 enrichment 分析。它很適合快速探索，以及 gget for Data Analysis 工作流程。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

適用於 PyTorch Geometric 圖神經網路的 torch-geometric 技能指南。可用來取得 torch-geometric 安裝協助、torch-geometric 使用方式、圖分類、節點分類、連結預測、異質圖、自訂 MessagePassing 層，以及為 Machine Learning 工作流程擴展 GNN。

Machine Learning

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能可協助你精準處理化學資訊工作流程：解析 SMILES、SDF、MOL、PDB 與 InChI；計算描述子；產生指紋；執行子結構搜尋；處理反應；以及建立 2D/3D 座標。這份 rdkit 指南適合進階控制、自訂清理，以及用 rdkit 進行 Data Analysis 工作流程。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 可協助你安裝並使用一套 Hugging Face 視覺訓練技能，支援物件偵測、影像分類，以及 SAM/SAM2 分割等訓練工作。內容涵蓋資料集準備、雲端 GPU 環境設定、評估、Trackio 記錄與將結果推送到 Hub。很適合後端自動化與可重複的訓練流程。

後端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 透過 DataForSEO MCP server 將 Claude 連接到即時 SEO 資料，支援 SERP 檢查、關鍵字研究、反向連結、頁面內分析、競品研究、商家資訊，以及 AI 可見度追蹤。這個技能特別適合需要真實搜尋證據、清楚安裝指引與實用 seo-dataforseo 用法的資料導向工作流程。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一項用於在 Python 中建立、擬合、檢查與比較機率模型的 Bayesian 建模技能。可用 pymc 進行階層式迴歸、多層次分析、時間序列、缺失值、量測誤差，以及搭配 LOO 或 WAIC 的模型比較。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

geopandas 的 Python 地理空間向量資料分析技能，涵蓋 shapefiles、GeoJSON 與 GeoPackage 檔案。可用來讀取、清理、合併、建立緩衝區、裁切、重新投影與匯出空間資料，減少試錯。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

Analyzing-threat-intelligence-feeds 可協助你匯入 CTI feeds、標準化指標、評估 feed 品質，並為 STIX 2.1 工作流程強化 IOCs。這個 analyzing-threat-intelligence-feeds 技能專為威脅情資作業與資料分析而設，提供 TAXII、MISP 與商業 feeds 的實務指引。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是一個用於 Python 中 Azure AI Text Analytics 的技能。它可協助進行情感分析、實體辨識、關鍵片語擷取、語言偵測、PII 偵測與醫療保健 NLP。當你需要快速完成 Azure 用戶端設定、驗證，以及在應用程式、Notebook 或資料分析工作流程中實作實用的文字分析時，這個技能很適合。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一個 GitHub 技能，可在 Python 中直接執行 ClickHouse SQL，且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢，以及針對本機檔案與外部資料來源的後端開發工作流程。

後端开发

收藏 0GitHub 0