diffdock 是一项对接技能,可基于 PDB 结构,或蛋白序列加上以 SMILES、SDF、MOL2 表示的配体,预测蛋白-配体结合构象。适用于基于结构的药物设计、虚拟筛选以及带置信度评分的构象分析。它不用于结合亲和力预测。

Stars21.3k
收藏0
评论0
收录时间2026年5月14日
分类数据分析
安装命令
npx skills add K-Dense-AI/claude-scientific-skills --skill diffdock
编辑评分

该技能评分为 78/100,属于 Agent Skills Finder 中较稳妥的收录候选。目录用户已经能从中看到足够真实的工作流信息来决定是否安装:它明确面向 DiffDock 蛋白-配体对接,包含批量与单复合物工作流,并提供辅助脚本和参考文档,减少了仅靠通用提示词时的试错成本。

78/100
亮点
  • 任务指向明确:frontmatter 和概览直接将该技能定位为基于扩散模型的分子对接,输入可来自 PDB/SMILES。
  • 工作流支持到位:仓库包含 3 个脚本,以及批量 CSV 和推理配置模板,便于代理准备输入并分析输出。
  • 指导深度不错:参考文档覆盖参数、工作流/示例,以及置信度与局限性,提高了安装决策价值和执行清晰度。
注意点
  • SKILL.md 中没有安装命令,因此用户可能需要根据引用的工作流自行推断环境搭建方式,而不是直接使用仓库内的一键安装路径。
  • 该技能聚焦于构象预测和置信度评估,不做亲和力预测;如果用户需要估算结合能,还需配合其他工具。
概览

diffdock 技能概览

diffdock 是做什么的

DiffDock 是一个以 docking 为核心的技能,用于根据蛋白结构或序列加上配体输入,预测 protein-ligand 的结合姿势。当前需要回答“这个化合物可能在哪里、又会以什么方式结合”时,应该使用 diffdock 技能,而不是去估算 binding affinity。

最适合的场景与边界

diffdock 适合 structure-based drug design、virtual screening,以及后续分析所需的 pose generation。下面这些情况就不太适合:你只关心按 potency 排名;你的蛋白靶点高度柔性;或者你需要的是通用化学工作流,而不是 pose 预测工作流。

它为什么有用

diffdock 的主要价值在于,它把单复合物 docking、批量筛选、confidence scoring,以及基于序列的蛋白输入整合在一条工作流里。也正因为如此,当你既想要一条可执行的 docking 路径,又希望有足够的提示避免误读分数时,安装 diffdock 就很值得。

如何使用 diffdock 技能

安装并先看工作流

先把 diffdock 技能安装到你的 Claude skills 环境里,然后第一步打开 SKILL.md。接着再阅读 references/workflows_examples.mdreferences/parameters_reference.mdreferences/confidence_and_limitations.md,先弄清楚实际输入格式、默认值和分数该怎么解读,再正式跑任务。

把任务转成可执行的提示

使用 diffdock 时,最好一开始就把蛋白格式、配体格式和任务类型说清楚。好的输入要具体,例如:“把这个 SMILES dock 到这个 PDB,并返回前 5 个 poses 及其 confidence 解读”,或者“为这些 ligands 对一个 receptor 做批量 docking 准备流程。” 只说“运行 diffdock”是不够的,因为这样看不出技能到底该用文件、序列,还是 CSV 批处理。

选对文件和输出

单次 docking 时,从蛋白 PDB 和 SMILES、SDF 或 MOL2 格式的配体开始。批量任务则使用 assets/batch_template.csv 里的 CSV 模板,如果你希望在执行前先做校验,可以查看 scripts/prepare_batch_csv.py。任务跑完后,scripts/analyze_results.py 可以帮你汇总 pose 排名和 confidence 分数,这样就不用手动逐个检查每个输出文件。

实际部署的小技巧

DiffDock 的安装和首次运行,可能会因为 model weights 和 lookup-table 生成而变慢,所以要把这部分启动成本算进去。如果你的蛋白没有现成结构,技能也支持基于序列的 folding,但这会引入额外不确定性;只有在没有实验结构时再用它,不要把它当成默认快捷方式。只有在任务比较难的时候才调整 sampling,因为更多 samples 虽然能扩大搜索覆盖,但也会增加算力消耗和后处理工作量。

diffdock 技能 FAQ

diffdock 只支持 PDB 文件吗?

不是。diffdock 技能支持蛋白结构,也支持某些工作流中的蛋白序列,并在 docking 前先把序列折叠成结构。只要你手头有现成的 PDB,还是优先使用它,因为由序列推导出来的结构会再引入一层误差。

diffdock 会预测 affinity 吗?

不会。DiffDock 预测的是 binding poses 和 confidence,不是 binding affinity。如果你需要类似 affinity 的优先级判断,应该在 diffdock 之后再接一个 scoring 或 rescoring 步骤,而不是把 confidence 直接当成 potency。

diffdock 技能适合新手吗?

如果任务足够简单,那么适合:一个 receptor、一个 ligand、一个 pose 问题。难点会出现在你需要批量整理、处理柔性蛋白,或者对低 confidence 样本做谨慎解读的时候。这个技能对 docking 上手友好,但不能替代领域判断。

什么情况下不该用它?

当靶点的构象变化本身就是主要结合机制时,不要依赖 diffdock;或者你只有一个非常不确定的 ligand 表达时,也不适合。若你的真正问题是 SAR、selectivity 或 ADMET,那么它也不能代替完整的 medicinal chemistry 分析流程。

如何改进 diffdock 技能

给技能更好的分子上下文

diffdock 的最佳结果通常来自干净的输入:正确的 receptor 文件、具有明确 protonation 假设的 ligand,以及清晰定义的 binding 问题。如果 binding site 已经知道,就明确说明;如果是 blind docking,也要直接说出来,因为搜索策略和预期 confidence 都会不同。

明确你真正要用的输出

想把 diffdock 用得更好,就要说清楚你要的是 top pose、top 5 poses、batch screening,还是按 confidence 排序的候选项。如果你后面还要做对比分析,就要求输出保持一致的文件命名,并附带 summary table。这样可以减少歧义,也更方便把结果接到 Data Analysis 或 screening 报告里。

注意常见失败模式

最常见的错误有三个:把 confidence 当成 affinity、ligand preparation 做得不好,以及对超出模型舒适区的蛋白结果过度信任。如果结果看起来不稳定,可以重新跑并增加 samples,比较多个 top poses,同时检查真正卡住你的到底是 ligand chemistry 还是 protein state,而不是先默认是模型失效。

用有针对性的后续提示持续迭代

第一次跑完后,下一轮 diffdock 提示最好直接针对具体问题改进:比如 binding site 放错、pose clustering 不一致,或者 confidence 分数偏低。这样比泛泛地要求“重跑一次”更有效。若你需要 diffdock 用于 Data Analysis,就把希望从输出里提取的指标写清楚,例如 rank distribution、score thresholds,或者按复合物汇总的摘要。

评分与评论

暂无评分
分享你的评价
登录后即可为这个技能评分并发表评论。
G
0/10000
最新评论
保存中...