diffdock 是一個 docking 技能,可根據 PDB 結構,或蛋白質序列搭配以 SMILES、SDF 或 MOL2 表示的配體,預測 protein-ligand 的結合姿勢。可用於結構導向藥物設計、虛擬篩選,以及帶有信心分數的 pose 分析。它不適用於結合親和力預測。

Stars21.3k
收藏0
評論0
加入時間2026年5月14日
分類数据分析
安裝指令
npx skills add K-Dense-AI/claude-scientific-skills --skill diffdock
編輯評分

這個技能評分 78/100,屬於 Agent Skills Finder 的不錯收錄候選。目錄使用者可以從中看到足夠的實際工作流程內容來判斷是否安裝:它明確鎖定 DiffDock 的 protein-ligand docking,包含批次與單一複合體流程,並提供輔助腳本與參考文件,降低只靠一般提示詞推敲的成本。

78/100
亮點
  • 任務觸發明確:frontmatter 與概覽清楚說明此技能用於從 PDB/SMILES 輸入進行 diffusion-based molecular docking。
  • 操作流程支援完整:repository 內含 3 個 scripts,以及 batch CSV 和 inference config templates,能幫助 agent 準備輸入並分析輸出。
  • 指引深度不錯:reference docs 涵蓋 parameters、workflows/examples,以及 confidence/limitations,提升安裝決策價值與執行清晰度。
注意事項
  • SKILL.md 沒有 install command,因此使用者可能需要從參考工作流程推導設定方式,而不是直接照著 repo 內的一步到位安裝路徑操作。
  • 這個技能聚焦於 pose prediction 與 confidence,不是 affinity prediction;若使用者要做 binding-energy estimation,還需要其他工具。
總覽

diffdock 技能概覽

diffdock 是用來做什麼的

DiffDock 是一個以 docking 為核心的技能,用來根據蛋白質結構或序列,加上配體輸入,預測蛋白質-配體的結合姿勢。當你想回答的是「這個化合物可能會怎麼、又會在哪裡結合?」而不是「它的結合親和力有多高?」時,就該用 diffdock 技能。

最適合的情境與判斷界線

diffdock 適合結構式藥物設計、虛擬篩選,以及供下游分析使用的 pose 生成。如果你只需要依效力排序、蛋白目標高度柔性,或你要的是一般化學工作流程而不是 pose 預測流程,這個技能就不是最佳選擇。

diffdock 為什麼有用

diffdock 的主要價值,在於它把單一複合體 docking、批次篩選、信心分數,以及以序列為基礎的蛋白輸入,整合進同一套工作流程。當你既需要可執行的 docking 路徑,又需要足夠的指引來避免誤讀分數時,安裝 diffdock 就很值得。

如何使用 diffdock 技能

安裝並先檢視工作流程

先把 diffdock 技能安裝到你的 Claude skills 設定中,然後第一步就打開 SKILL.md。接著再閱讀 references/workflows_examples.mdreferences/parameters_reference.mdreferences/confidence_and_limitations.md,先弄清楚實際的輸入格式、預設值與分數詮釋,再開始跑 job。

把你的任務改寫成可用的提示詞

在使用 diffdock 時,一開始就要把蛋白格式、配體格式與任務類型說清楚。好的輸入要具體,例如:「把這個 SMILES dock 到這個 PDB,並回傳前 5 個 poses 與信心分數解讀」或「針對這些 ligands 對單一 receptor 做 batch docking。」糟的輸入只是「run diffdock」,因為這樣看不出技能應該使用檔案、序列,還是 CSV 批次。

用對檔案與輸出

做單一 docking 時,先準備蛋白 PDB 和以 SMILES、SDF 或 MOL2 表示的 ligand。若是批次作業,請使用 assets/batch_template.csv 裡的 CSV 範本;如果你需要在執行前先做驗證,也可以檢查 scripts/prepare_batch_csv.py。跑完之後,scripts/analyze_results.py 可以幫你彙整 pose 排名與信心分數,避免你逐一人工檢視每個輸出檔。

實務設定建議

diffdock 的安裝與第一次執行,可能會因為 model weights 與 lookup-table 產生而變慢,所以要把這段設定成本算進去。如果你的蛋白沒有結構檔,技能也支援以序列進行 folding,但這會增加不確定性;只有在沒有實驗結構時才使用,不要把它當成預設捷徑。sampling 只有在任務較難時才調高,因為更多 samples 雖然能提升搜尋覆蓋度,也會增加運算量與後處理工作。

diffdock 技能 FAQ

diffdock 只支援 PDB 檔嗎?

不是。diffdock 技能支援蛋白質結構,在某些工作流程裡也支援先折疊再 docking 的蛋白序列。不過只要你有實際的 PDB,仍然應優先使用,因為由序列推導出的結構本身又多了一層誤差來源。

diffdock 會預測 affinity 嗎?

不會。DiffDock 預測的是 binding poses 和 confidence,不是 binding affinity。如果你需要類似 affinity 的優先排序,應該把 diffdock 和 scoring 或 rescoring 步驟搭配使用,而不是把 confidence 當成 potency。

diffdock 技能適合新手嗎?

如果你的任務很直接:一個 receptor、一個 ligand、一個 pose 問題,那就適合。當你需要批次整理、柔性蛋白,或要細緻解讀低信心樣本時,難度就會上升。這個技能對 docking 來說算是新手友善,但不是拿來取代領域判斷的。

什麼情況下不該用?

如果 target 的主要結合機制是構形變化,或你手上的 ligand 表示非常不確定,就不要依賴 diffdock。若你的真正問題是 SAR、selectivity 或 ADMET,它也不適合作為完整 medicinal chemistry 分析流程的替代品。

如何改進 diffdock 技能

提供更好的分子脈絡

diffdock 的最佳結果通常來自乾淨的輸入:正確的 receptor 檔、帶有已知質子化假設的 ligand,以及清楚定義的結合問題。如果已知 binding site,就直接說明;如果是 blind docking 任務,也要講清楚,因為搜尋策略與預期信心值會不同。

指定你真正會用到的輸出

要提升 diffdock 的使用效果,可以明確指定你要的是 top pose、前 5 個 poses、batch screening,還是依 confidence 排序的候選項。如果你之後要做比較,請要求一致的檔名規則與摘要表。這可以減少歧義,讓輸出更容易整合到 Data Analysis 或 screening 報告中。

注意常見失敗模式

最常見的錯誤,是把 confidence 當成 affinity、ligand 前處理不佳,以及對超出模型舒適範圍的蛋白結果過度信任。如果結果看起來不穩定,可以用更多 samples 重新執行,比較多個 top poses,並檢查真正卡住的是 ligand chemistry 或 protein state,而不是模型本身。

用有針對性的追問來迭代

第一次跑完後,下一輪 diffdock 提示詞要針對具體問題做修正:例如位點放錯、pose clustering 不一致,或 confidence 分數太低。這比泛泛地要求重跑更有用。當你需要把 diffdock 用在 Data Analysis 時,請直接說明你要從輸出中擷取的指標,例如 rank 分布、score 閾值,或每個複合體的摘要。

評分與評論

尚無評分
分享你的評論
登入後即可為這項技能評分並留言。
G
0/10000
最新評論
儲存中...