rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

Stars21.4k

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill rdkit

编辑评分

该技能评分为 84/100，说明它是一个适合需要 RDKit 专项化学信息学控制的用户的优质目录条目。仓库包含真实的工作流内容、清晰的触发指引，以及比通用提示更能减少试错的辅助脚本；但整体更偏参考资料，而不是开箱即用。

84/100

亮点

明确界定了何时使用 rdkit、何时使用 datamol，帮助代理为高级分子控制选择合适工具。
在 SKILL.md 中覆盖了较完整的工作流，并提供了 3 个支持脚本，分别用于性质、相似性检索和子结构过滤。
配有 API 调用、描述符和 SMARTS 模式的参考文件，提升了可触发性和操作清晰度。

注意点

SKILL.md 中没有安装命令，因此用户可能需要单独处理环境搭建。
部分内容更偏参考而非逐步操作，因此首次上手时仍可能需要具备一定的 RDKit 基础。

Python Chemistry 药物发现生物信息学

概览

rdkit 技能概述

rdkit 适合做什么

rdkit 技能适用于需要精确分子处理的化学信息学工作：解析 SMILES、SDF/MOL/PDB/InChI，计算描述符，生成 fingerprint，执行子结构搜索，以及处理反应或 2D/3D 坐标。当简单提示词不够用，而你需要 rdkit 技能正确套用 API 模式、标准化步骤和文件格式时，它最有价值。

最适合的人群和任务

如果你在做分子清洗、性质计算、相似性筛选、库过滤，或为药物发现和计算化学做基于结构的数据准备，这份 rdkit 指南就很适合你。对于 rdkit for Data Analysis 也同样适用，尤其是在你需要对大量分子做可复现的批处理，而不是一次性 notebook 探索时。

这项技能的不同之处

这个 rdkit 技能更强调细粒度控制，而不是图省事。仓库既支持直接使用 Python API，也提供了描述符、SMARTS 和相似性工作流的辅助脚本与参考文件。因此，相比通用提示词或轻量包装器，它更适合高级控制、自定义标准化和专门算法。

如何使用 rdkit 技能

安装并触发上下文

先把技能安装到你的 Claude skills 环境中，然后在请求里明确说明分子来源、输出目标和约束条件。一个好的 rdkit 安装流程，是同时给出化学任务和数据形态，例如 SMILES in CSV、SDF file、batch library 或 single query molecule。

提供正确的输入

高质量输入应包括准确的结构格式、目标操作，以及任何化学规则。例如：“用 rdkit 读取这个 SDF，移除无效分子，计算 MW/LogP/TPSA，并导出一个带 canonical SMILES 的 CSV。”如果你需要做子结构相关工作，请把 SMARTS 模式以及匹配是包含式还是排除式一并写清楚。

先读这些文件

先从 SKILL.md 开始，然后查看 references/api_reference.md、references/descriptors_reference.md 和 references/smarts_patterns.md，了解支持的方法和模式语法。如果你打算自动化批处理，再看看 scripts/molecular_properties.py、scripts/similarity_search.py 和 scripts/substructure_filter.py，这样能更直观看出这个仓库的实际工作流形态。

能显著提升输出的工作流建议

建议使用分阶段提示：先解析，再验证，然后转换，最后导出。要明确说明标准化是严格还是宽松，是否在意立体化学，以及你想保留 canonical SMILES 还是原始顺序。对 rdkit 的使用来说，这能避免一种常见失败模式：分子虽然能解析，但后续描述符或 fingerprint 却是在错误的分子形式上计算出来的。

rdkit 技能 FAQ

rdkit 比普通提示词更好吗？

通常是的，尤其当任务依赖精确 API、文件 I/O、SMARTS 语法或批处理时。普通提示词可以解释化学信息学概念，但当你需要可靠的 rdkit 安装指导、具体代码路径，以及对分子格式更少的假设时，rdkit 技能更合适。

什么时候不该用 rdkit？

如果你只需要高层级的分子摘要，而且对控制粒度要求很低，就不必选 rdkit。仓库本身也提到，datamol 可以作为 RDKit 的更简单封装，用于标准工作流；因此，当你需要的是直接 API 控制而不是便利性时，rdkit 才是更好的选择。

对新手友好吗？

如果任务范围收得足够窄，那就友好。新手可以直接让它做简单的 rdkit 用法，比如把 SMILES 转成性质，或者按 SMARTS 模式过滤分子。真正的阻碍通常不是化学知识，而是输入不够明确：文件类型不清楚、缺少电荷/立体化学规则，或者没有目标输出 schema。

我应该对这个生态有什么预期？

你应该预期的是以 Python 为核心的工作流：RDKit 模块、辅助脚本和参考表，而不是一个大型应用框架。rdkit 技能最适合你已经知道分子来源，并希望建立一个实用的分析或转换流水线时使用。

如何改进 rdkit 技能

先说清楚最关键的决定

最大的质量提升来自明确分子表示方式和成功标准。告诉 rdkit 技能这次任务是做描述符计算、相似性搜索、子结构过滤，还是结构转换，并定义什么算有效结果，比如“只保留已标准化的分子”或“保持立体化学不变”。

提前给出化学约束

常见失败模式都和隐含假设有关，比如盐、互变异构体、显式氢、芳香性和无效结构。如果这些会影响结果，请直接说明：例如“先去盐再算描述符”、“保留原始立体化学”或“把标准化失败视为拒绝，而不是尝试修复”。

使用具体的提示词模式

更强的提示词会像这样：“使用 rdkit 读取 molecules.smi，拒绝无效 SMILES，计算 MW、LogP、TPSA，并输出一个包含 canonical SMILES 和 passed 标记的 CSV。”这比“分析这些分子”更好，因为它明确告诉技能要解析什么、计算什么，以及结果该如何格式化。

迭代时盯住输出质量，而不只是代码

第一轮结果出来后，检查输出是否符合你的化学规则和下游工具链。如果结果看起来不对，就一次只补充一个约束：fingerprint 类型、SMARTS 库、描述符集合，或者导出格式。对于 rdkit for Data Analysis 来说，这通常比单纯要求更多功能，更能提升可复现性。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0

scvelo

作者 K-Dense-AI

scvelo 是一款用于单细胞 RNA-seq 数据中 RNA velocity 分析的 Python 技能。可用它根据未剪接和已剪接 mRNA 估计细胞状态转变、推断轨迹方向、计算 latent time，并识别 driver genes。对于需要超越标准聚类或 pseudotime、进一步判断方向性的 Data Analysis 场景，scvelo 尤其有用。

数据分析

收藏 0GitHub 0