diffdock

diffdock 是一项对接技能，可基于 PDB 结构，或蛋白序列加上以 SMILES、SDF、MOL2 表示的配体，预测蛋白-配体结合构象。适用于基于结构的药物设计、虚拟筛选以及带置信度评分的构象分析。它不用于结合亲和力预测。

Stars21.3k

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill diffdock

编辑评分

该技能评分为 78/100，属于 Agent Skills Finder 中较稳妥的收录候选。目录用户已经能从中看到足够真实的工作流信息来决定是否安装：它明确面向 DiffDock 蛋白-配体对接，包含批量与单复合物工作流，并提供辅助脚本和参考文档，减少了仅靠通用提示词时的试错成本。

78/100

亮点

任务指向明确：frontmatter 和概览直接将该技能定位为基于扩散模型的分子对接，输入可来自 PDB/SMILES。
工作流支持到位：仓库包含 3 个脚本，以及批量 CSV 和推理配置模板，便于代理准备输入并分析输出。
指导深度不错：参考文档覆盖参数、工作流/示例，以及置信度与局限性，提高了安装决策价值和执行清晰度。

注意点

SKILL.md 中没有安装命令，因此用户可能需要根据引用的工作流自行推断环境搭建方式，而不是直接使用仓库内的一键安装路径。
该技能聚焦于构象预测和置信度评估，不做亲和力预测；如果用户需要估算结合能，还需配合其他工具。

生物信息学 Machine Learning Python 科学 Drug Sensitivity 蛋白质 Biology 制药

概览

diffdock 技能概览

diffdock 是做什么的

DiffDock 是一个以 docking 为核心的技能，用于根据蛋白结构或序列加上配体输入，预测 protein-ligand 的结合姿势。当前需要回答“这个化合物可能在哪里、又会以什么方式结合”时，应该使用 diffdock 技能，而不是去估算 binding affinity。

最适合的场景与边界

diffdock 适合 structure-based drug design、virtual screening，以及后续分析所需的 pose generation。下面这些情况就不太适合：你只关心按 potency 排名；你的蛋白靶点高度柔性；或者你需要的是通用化学工作流，而不是 pose 预测工作流。

它为什么有用

diffdock 的主要价值在于，它把单复合物 docking、批量筛选、confidence scoring，以及基于序列的蛋白输入整合在一条工作流里。也正因为如此，当你既想要一条可执行的 docking 路径，又希望有足够的提示避免误读分数时，安装 diffdock 就很值得。

如何使用 diffdock 技能

安装并先看工作流

先把 diffdock 技能安装到你的 Claude skills 环境里，然后第一步打开 SKILL.md。接着再阅读 references/workflows_examples.md、references/parameters_reference.md 和 references/confidence_and_limitations.md，先弄清楚实际输入格式、默认值和分数该怎么解读，再正式跑任务。

把任务转成可执行的提示

使用 diffdock 时，最好一开始就把蛋白格式、配体格式和任务类型说清楚。好的输入要具体，例如：“把这个 SMILES dock 到这个 PDB，并返回前 5 个 poses 及其 confidence 解读”，或者“为这些 ligands 对一个 receptor 做批量 docking 准备流程。” 只说“运行 diffdock”是不够的，因为这样看不出技能到底该用文件、序列，还是 CSV 批处理。

选对文件和输出

单次 docking 时，从蛋白 PDB 和 SMILES、SDF 或 MOL2 格式的配体开始。批量任务则使用 assets/batch_template.csv 里的 CSV 模板，如果你希望在执行前先做校验，可以查看 scripts/prepare_batch_csv.py。任务跑完后，scripts/analyze_results.py 可以帮你汇总 pose 排名和 confidence 分数，这样就不用手动逐个检查每个输出文件。

实际部署的小技巧

DiffDock 的安装和首次运行，可能会因为 model weights 和 lookup-table 生成而变慢，所以要把这部分启动成本算进去。如果你的蛋白没有现成结构，技能也支持基于序列的 folding，但这会引入额外不确定性；只有在没有实验结构时再用它，不要把它当成默认快捷方式。只有在任务比较难的时候才调整 sampling，因为更多 samples 虽然能扩大搜索覆盖，但也会增加算力消耗和后处理工作量。

diffdock 技能 FAQ

diffdock 只支持 PDB 文件吗？

不是。diffdock 技能支持蛋白结构，也支持某些工作流中的蛋白序列，并在 docking 前先把序列折叠成结构。只要你手头有现成的 PDB，还是优先使用它，因为由序列推导出来的结构会再引入一层误差。

diffdock 会预测 affinity 吗？

不会。DiffDock 预测的是 binding poses 和 confidence，不是 binding affinity。如果你需要类似 affinity 的优先级判断，应该在 diffdock 之后再接一个 scoring 或 rescoring 步骤，而不是把 confidence 直接当成 potency。

diffdock 技能适合新手吗？

如果任务足够简单，那么适合：一个 receptor、一个 ligand、一个 pose 问题。难点会出现在你需要批量整理、处理柔性蛋白，或者对低 confidence 样本做谨慎解读的时候。这个技能对 docking 上手友好，但不能替代领域判断。

什么情况下不该用它？

当靶点的构象变化本身就是主要结合机制时，不要依赖 diffdock；或者你只有一个非常不确定的 ligand 表达时，也不适合。若你的真正问题是 SAR、selectivity 或 ADMET，那么它也不能代替完整的 medicinal chemistry 分析流程。

如何改进 diffdock 技能

给技能更好的分子上下文

diffdock 的最佳结果通常来自干净的输入：正确的 receptor 文件、具有明确 protonation 假设的 ligand，以及清晰定义的 binding 问题。如果 binding site 已经知道，就明确说明；如果是 blind docking，也要直接说出来，因为搜索策略和预期 confidence 都会不同。

明确你真正要用的输出

想把 diffdock 用得更好，就要说清楚你要的是 top pose、top 5 poses、batch screening，还是按 confidence 排序的候选项。如果你后面还要做对比分析，就要求输出保持一致的文件命名，并附带 summary table。这样可以减少歧义，也更方便把结果接到 Data Analysis 或 screening 报告里。

注意常见失败模式

最常见的错误有三个：把 confidence 当成 affinity、ligand preparation 做得不好，以及对超出模型舒适区的蛋白结果过度信任。如果结果看起来不稳定，可以重新跑并增加 samples，比较多个 top poses，同时检查真正卡住你的到底是 ligand chemistry 还是 protein state，而不是先默认是模型失效。

用有针对性的后续提示持续迭代

第一次跑完后，下一轮 diffdock 提示最好直接针对具体问题改进：比如 binding site 放错、pose clustering 不一致，或者 confidence 分数偏低。这样比泛泛地要求“重跑一次”更有效。若你需要 diffdock 用于 Data Analysis，就把希望从输出里提取的指标写清楚，例如 rank distribution、score thresholds，或者按复合物汇总的摘要。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0