rdkit

作者 K-Dense-AI

rdkit 技能可協助你精準處理化學資訊工作流程：解析 SMILES、SDF、MOL、PDB 與 InChI；計算描述子；產生指紋；執行子結構搜尋；處理反應；以及建立 2D/3D 座標。這份 rdkit 指南適合進階控制、自訂清理，以及用 rdkit 進行 Data Analysis 工作流程。

Stars21.4k

評論0

加入時間2026年5月14日

分類数据分析

安裝指令

npx skills add K-Dense-AI/claude-scientific-skills --skill rdkit

編輯評分

這個技能獲得 84/100，代表它非常適合需要 RDKit 特定化學資訊控制的使用者。這個 repository 展示了真實可用的工作流程內容、清楚的觸發指引，以及能減少猜測的輔助腳本；相較於通用提示詞更具操作性，但偏重參考內容，沒有那麼像開箱即用的完整方案。

84/100

亮點

明確界定何時使用 rdkit、何時使用 datamol，幫助代理在進階分子控制情境中選對工具。
在 SKILL.md 中涵蓋了相當完整的工作流程，並附帶三個支援腳本，用於性質計算、相似度搜尋與子結構篩選。
提供 API 呼叫、描述子與 SMARTS patterns 的參考檔，有助於提升可觸發性與操作清晰度。

注意事項

SKILL.md 沒有安裝指令，因此使用者可能需要另外處理環境設定。
部分內容偏向參考手冊而非逐步教學，所以第一次導入時可能仍需要具備 RDKit 基礎。

Python Chemistry 药物发现生物信息学

總覽

rdkit 技能概覽

rdkit 是做什麼的

rdkit 技能適合需要精準分子處理的化學資訊學工作：解析 SMILES、SDF/MOL/PDB/InChI、計算描述子、產生指紋、執行子結構搜尋，以及處理反應或 2D/3D 座標。當單純下提示還不夠、你需要 rdkit 技能套用正確的 API 模式、清理步驟與檔案格式時，它最有用。

最適合的使用者與工作

如果你在做分子清理、性質計算、相似度篩選、資料庫過濾，或藥物發現與計算化學中的結構型資料前處理，這份 rdkit 指南就很適合。當你需要對大量分子做可重現的批次處理，而不是只在 notebook 裡做一次性探索時，rdkit for Data Analysis 也非常適用。

這個技能有什麼不同

這個 rdkit 技能重視細緻控制，而不是只求方便。倉庫同時支援直接使用 Python API、輔助腳本，以及用於描述子、SMARTS 與相似度流程的參考檔。這讓它在進階控制、自訂清理與專門演算法方面，比一般提示詞或輕量包裝層更合適。

如何使用 rdkit 技能

安裝並觸發情境

先把這個技能安裝到你的 Claude skills 環境，接著把需求講清楚：分子來源是什麼、輸出目標是什麼、有哪些限制。理想的 rdkit 安裝與使用流程，會同時提供化學任務與資料形狀，例如 CSV 裡的 SMILES、SDF 檔、批次資料庫 或 單一查詢分子。

提供正確的輸入給技能

好的輸入應該包含精確的結構格式、要執行的操作，以及任何化學規則。比如：「用 rdkit 讀取這個 SDF，移除無效分子，計算 MW/LogP/TPSA，並匯出含 canonical SMILES 的 CSV。」如果需要做子結構處理，也要把 SMARTS pattern 以及比對是包含式還是排除式一併寫清楚。

先看這些檔案

先從 SKILL.md 開始，再查看 references/api_reference.md、references/descriptors_reference.md 和 references/smarts_patterns.md，了解支援的方法與 pattern 語法。如果你打算把批次工作自動化，也要看 scripts/molecular_properties.py、scripts/similarity_search.py 和 scripts/substructure_filter.py，掌握這個 repo 的實作工作流程長什麼樣子。

能提升輸出品質的工作流程建議

建議採用分段式提示：先解析、再驗證、接著轉換，最後匯出。要明確說明清理是否必須嚴格、是否允許寬鬆處理、立體化學是否重要，以及你要 canonical SMILES 還是保留原始順序。對 rdkit 使用來說，這能避免常見失誤：分子雖然成功解析了，但後續描述子或指紋卻是建立在錯誤形式上。

rdkit 技能 FAQ

rdkit 比一般提示詞更好嗎？

通常是，尤其當任務依賴精確 API、檔案 I/O、SMARTS 語法或批次處理時更明顯。一般提示詞可以描述化學資訊學概念，但當你需要可靠的 rdkit 安裝指引、具體程式路徑，以及更少的分子格式假設時，rdkit 技能會更適合。

什麼情況下不該用 rdkit？

如果你只需要高層次的分子摘要、而且幾乎不需要控制細節，就不必選 rdkit。倉庫本身也提到，datamol 可以作為 RDKit 的較簡單包裝層，適合標準流程；因此當你要的是直接 API 控制，而不是便利性時，rdkit 才是更好的選擇。

對初學者友善嗎？

如果任務範圍切得夠小，答案是可以。初學者可以直接要求簡單的 rdkit 用法，例如把 SMILES 轉成性質，或用 SMARTS pattern 過濾分子。真正的阻礙通常不是化學知識，而是輸入不夠明確：檔案類型不清楚、缺少電荷/立體化學規則，或沒有定義目標輸出 schema。

這個生態系統我該有什麼期待？

可以預期的是以 Python 為主的工作流，包含 RDKit 模組、輔助腳本與參考表，而不是大型應用框架。當你已經知道分子資料來源，並且想要一條務實的分析或轉換管線時，rdkit 技能表現最好。

如何改進 rdkit 技能

先從最重要的決策開始

最大的品質提升，來自把分子表示法與成功標準講清楚。要告訴 rdkit 技能這次任務是描述子計算、相似度搜尋、子結構過濾，還是結構轉換；並明確定義什麼算有效結果，例如「只接受已清理過的分子」或「保留立體化學不變」。

事先交代化學限制

常見失誤，往往來自對鹽類、互變異構、顯式氫、芳香性與無效結構的隱含假設。若這些會影響結果，就直接說明，例如「計算描述子前先去鹽」、「保留原始立體化學」，或「把清理失敗視為拒絕，而不是自動修補」。

使用具體的提示詞模式

更強的提示會像這樣：「使用 rdkit 讀取 molecules.smi，拒絕無效 SMILES，計算 MW、LogP、TPSA，並輸出含 canonical SMILES 與 passed 標記的 CSV。」這比「分析這些分子」更好，因為它清楚說明技能要解析什麼、計算什麼，以及結果要怎麼格式化。

迭代要從輸出品質下手，不只是程式碼

第一次產出後，先檢查結果是否符合你的化學規則與下游工具鏈。如果結果看起來不對，就一次只補一個限制：指紋類型、SMARTS 資料庫、描述子集合，或匯出格式。對 rdkit for Data Analysis 來說，這通常比要求更多功能，更能提升可重現性。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一個相容 pandas 的技能，透過 ClickHouse 支援的 DataStore API 提供快速資料分析。它支援檔案、資料庫與雲端連接器、跨來源 JOIN，以及只需極少程式碼變更的 pandas 風格工作流程。當你需要一個可直接替換、用於較大資料集的分析層時，可以使用這份 chdb-datastore 指南。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中進行精確的符號數學運算，涵蓋代數、微積分、矩陣、物理公式、數論、幾何與程式碼生成。它能幫助你維持表達式的精確性、選對 SymPy 模組，並避免過度依賴浮點數造成的錯誤。最適合需要實用 sympy 指南來處理符號工作流程，以及在 Data Analysis 中使用 sympy 的使用者。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可協助解讀 Culture Index 問卷、個人檔案匯出內容，以及相關的招募或教練筆記。這個 interpreting-culture-index 技能適合用於職務適配、團隊動態、倦怠風險、候選人回饋簡報、入職規劃與衝突調解。它強調依箭頭相對位置來閱讀、檢查反模式，以及產出實用的分析結果，支援資料分析與決策判斷。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是 Python 版的 Azure AI Search 技能，適合後端開發，涵蓋安裝、驗證、索引設計、向量搜尋、混合搜尋、語意排序與 agentic retrieval。當你需要從環境設定一路到可運作的查詢模式的實作指引時，適合使用 azure-search-documents-py 技能。

後端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一個生物資訊技能，可透過 CLI 或 Python 快速、統一地存取 20+ 個基因組資料庫與分析工具。適合查詢基因資訊、BLAST 相關資料、AlphaFold 結構、表現量資料、疾病關聯，以及進行類 enrichment 分析。它很適合快速探索，以及 gget for Data Analysis 工作流程。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

適用於 PyTorch Geometric 圖神經網路的 torch-geometric 技能指南。可用來取得 torch-geometric 安裝協助、torch-geometric 使用方式、圖分類、節點分類、連結預測、異質圖、自訂 MessagePassing 層，以及為 Machine Learning 工作流程擴展 GNN。

Machine Learning

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 可協助你安裝並使用一套 Hugging Face 視覺訓練技能，支援物件偵測、影像分類，以及 SAM/SAM2 分割等訓練工作。內容涵蓋資料集準備、雲端 GPU 環境設定、評估、Trackio 記錄與將結果推送到 Hub。很適合後端自動化與可重複的訓練流程。

後端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 透過 DataForSEO MCP server 將 Claude 連接到即時 SEO 資料，支援 SERP 檢查、關鍵字研究、反向連結、頁面內分析、競品研究、商家資訊，以及 AI 可見度追蹤。這個技能特別適合需要真實搜尋證據、清楚安裝指引與實用 seo-dataforseo 用法的資料導向工作流程。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一項用於在 Python 中建立、擬合、檢查與比較機率模型的 Bayesian 建模技能。可用 pymc 進行階層式迴歸、多層次分析、時間序列、缺失值、量測誤差，以及搭配 LOO 或 WAIC 的模型比較。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

geopandas 的 Python 地理空間向量資料分析技能，涵蓋 shapefiles、GeoJSON 與 GeoPackage 檔案。可用來讀取、清理、合併、建立緩衝區、裁切、重新投影與匯出空間資料，減少試錯。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

Analyzing-threat-intelligence-feeds 可協助你匯入 CTI feeds、標準化指標、評估 feed 品質，並為 STIX 2.1 工作流程強化 IOCs。這個 analyzing-threat-intelligence-feeds 技能專為威脅情資作業與資料分析而設，提供 TAXII、MISP 與商業 feeds 的實務指引。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是一個用於 Python 中 Azure AI Text Analytics 的技能。它可協助進行情感分析、實體辨識、關鍵片語擷取、語言偵測、PII 偵測與醫療保健 NLP。當你需要快速完成 Azure 用戶端設定、驗證，以及在應用程式、Notebook 或資料分析工作流程中實作實用的文字分析時，這個技能很適合。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一個 GitHub 技能，可在 Python 中直接執行 ClickHouse SQL，且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢，以及針對本機檔案與外部資料來源的後端開發工作流程。

後端开发

收藏 0GitHub 0

scvelo

作者 K-Dense-AI

scvelo 是一個用於單細胞 RNA-seq 資料中 RNA velocity 分析的 Python 技能。可用來根據未剪接與已剪接 mRNA 估計細胞狀態轉換、推斷軌跡方向、計算潛在時間，並找出驅動基因。當你需要超越一般分群或偽時間、進一步掌握方向性時，這個 skill 尤其適合用於 scvelo for Data Analysis。

数据分析

收藏 0GitHub 0