rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

スター21.4k

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill rdkit

編集スコア

この skill は 84/100 で、RDKit 固有の化学情報制御を必要とするユーザーに向いた、十分に実用的なディレクトリ掲載です。リポジトリには実際のワークフロー例、明確な使いどころの案内、そして汎用的なプロンプトより迷いを減らせる補助スクリプトがそろっています。一方で、すぐに使える完成形というより、参照用の比重がやや高めです。

84/100

強み

rdkit を使うべき場面と datamol を使うべき場面を明確に切り分けており、より高度な分子制御に適したツール選定を助けます。
SKILL.md に豊富なワークフローを収録し、さらにプロパティ、類似検索、部分構造フィルタリング用の 3 つの補助スクリプトが付属しています。
API 呼び出し、記述子、SMARTS パターンの参照ファイルがあり、トリガーのしやすさと運用面のわかりやすさが向上しています。

注意点

SKILL.md にインストールコマンドがないため、環境構築は別途対応する必要があります。
内容の一部は手順書というより参照資料寄りなので、初めて導入する場合は RDKit の基礎知識が必要になる可能性があります。

Python Chemistry Drug Discovery Bioinformatics

概要

rdkit スキルの概要

rdkit は何に使うのか

rdkit スキルは、分子を正確に扱う必要があるケモインフォマティクス作業向けです。SMILES、SDF/MOL/PDB/InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の取り扱いなどに使います。単純なプロンプトだけでは足りず、適切な API パターン、サニタイズ手順、ファイル形式を選びたい場面で特に有効です。

どんな人・どんな作業に向いているか

創薬や計算化学のために、分子のクレンジング、物性計算、類似性スクリーニング、ライブラリフィルタリング、構造ベースのデータ準備を行うなら、この rdkit ガイドが向いています。単発のノートブック探索ではなく、多数の分子に対して再現性のあるバッチ処理を回したい rdkit for Data Analysis にもよく合います。

このスキルが他と違う点

この rdkit スキルは、手軽さよりも細かな制御を重視します。リポジトリには、記述子、SMARTS、類似性ワークフロー向けの直接的な Python API 利用に加えて、補助スクリプトや参照ファイルが用意されています。そのため、汎用的なプロンプトや軽量ラッパーよりも、詳細な制御、独自のサニタイズ、特殊なアルゴリズムを使いたい場合に向いています。

rdkit スキルの使い方

インストールして、文脈をはっきり伝える

Claude の skills 環境にこのスキルをインストールしたうえで、分子の元データ、出力の目的、制約を明確に伝えてください。SMILES in CSV、SDF file、batch library、single query molecule のように、化学タスクとデータの形をセットで示すのが、rdkit のインストール後の使い方として効果的です。

入力は必要な情報をそろえて渡す

強い入力には、正確な構造形式、実行したい操作、そして化学ルールが含まれます。たとえば「この SDF を rdkit で読み込み、無効な分子を除外し、MW/LogP/TPSA を計算して、canonical SMILES 付きの CSV を出力して」といった指定です。部分構造を扱うなら、SMARTS パターンと、マッチを含めるのか除外するのかも明記してください。

先に確認すべきファイル

まず SKILL.md を読み、そのあと references/api_reference.md、references/descriptors_reference.md、references/smarts_patterns.md を見て、対応メソッドやパターン構文を確認してください。バッチ処理を自動化する予定なら、scripts/molecular_properties.py、scripts/similarity_search.py、scripts/substructure_filter.py を読んで、リポジトリが想定している実践的なワークフローの形を把握しておくとよいです。

出力を良くするワークフローのコツ

プロンプトは、解析→検証→変換→出力、という段階を分けて書くのがおすすめです。サニタイズを厳密にするのか、ある程度許容するのか、立体化学が重要か、canonical SMILES にするか元の順序を保つかを明示してください。rdkit の利用では、分子の読み込みはできても、その後の記述子やフィンガープリントが意図しない形で計算される、という典型的な失敗を避けやすくなります。

rdkit スキル FAQ

rdkit は通常のプロンプトより優れているか

ファイル I/O、SMARTS の構文、バッチ処理、正確な API が必要なタスクなら、たいていはその通りです。通常のプロンプトでもケモインフォマティクスの概念は説明できますが、信頼できる rdkit のインストール案内、具体的なコードパス、分子形式に関する不要な推測を減らしたいなら、rdkit スキルのほうが適しています。

どんなときに rdkit を使わないほうがいいか

細かな制御がいらず、高レベルな分子サマリーだけ欲しいなら選ばないほうがよいです。リポジトリ自体も、標準的なワークフローでは datamol のほうが RDKit のシンプルなラッパーとして使いやすいと示しています。つまり、利便性よりも直接的な API 制御が必要なときに rdkit が向いています。

初心者でも使いやすいか

タスクを狭く切れば使いやすいです。初心者でも、SMILES を物性値に変換する、SMARTS パターンで分子をフィルタする、といった基本的な rdkit の使い方を依頼できます。つまずきやすいのは化学の知識不足よりも入力のあいまいさで、ファイル形式が不明、電荷や立体化学のルールが未指定、出力スキーマがない、といったケースです。

エコシステムには何を期待すればよいか

大規模なアプリ基盤というより、Python ファーストのワークフロー、RDKit モジュール、補助スクリプト、参照表が中心だと考えてください。分子の元データがすでに決まっていて、実用的な解析または変換パイプラインを組みたいときに、rdkit スキルは最も力を発揮します。

rdkit スキルを改善するには

まず最重要の判断を明確にする

品質を最も大きく左右するのは、分子表現と成功条件をはっきり指定することです。タスクが記述子計算なのか、類似性検索なのか、部分構造フィルタなのか、構造変換なのかを rdkit スキルに伝え、さらに「サニタイズ済み分子のみ」「立体化学を保持する」など、何を有効な結果とみなすかを定義してください。

化学上の制約は先に伝える

よくある失敗は、塩、互変異性体、明示的な水素、芳香族性、無効構造に関する前提が隠れてしまうことです。これらが重要なら、たとえば「記述子計算の前に塩を除去する」「元の立体化学を保持する」「サニタイズ失敗は修復ではなく除外として扱う」といった形で、はっきり書いてください。

具体的なプロンプトの型を使う

より強いプロンプトは、たとえば次のようになります。「rdkit を使って molecules.smi を読み込み、無効な SMILES を除外し、MW、LogP、TPSA を計算し、canonical SMILES と passed フラグ付きの CSV を作成して。」
これは「これらの分子を分析して」より優れています。なぜなら、何を解析し、何を計算し、どう出力するかまで具体的に指定しているからです。

コードだけでなく、出力品質から改善する

最初の結果を見たら、出力が化学ルールと下流ツールチェーンに合っているか確認してください。ずれている場合は、一度に一つずつ制約を足していきます。たとえば、フィンガープリントの種類、SMARTS ライブラリ、記述子セット、出力形式です。rdkit for Data Analysis では、機能を増やすよりも、この進め方のほうが再現性を高めやすいです。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0

scvelo

作成者 K-Dense-AI

scvelo は、単一細胞 RNA-seq データにおける RNA velocity 解析のための Python スキルです。未スプライス／スプライス済み mRNA から細胞状態遷移を推定し、軌道の方向性を推論し、latent time を算出し、driver genes を特定するのに使えます。標準的なクラスタリングや pseudotime だけでは方向性が足りない Data Analysis での scvelo に特に有用です。

Data Analysis

お気に入り 0GitHub 0