diffdockは、PDB構造、またはタンパク質配列とSMILES、SDF、MOL2形式のリガンドから、タンパク質-リガンド結合ポーズを予測するドッキングスキルです。構造ベース創薬、バーチャルスクリーニング、信頼度付きポーズ解析にdiffdockスキルを活用できます。結合親和性の予測には対応していません。

スター21.3k
お気に入り0
コメント0
追加日2026年5月14日
カテゴリーData Analysis
インストールコマンド
npx skills add K-Dense-AI/claude-scientific-skills --skill diffdock
編集スコア

このスキルは78/100点で、Agent Skills Finderで十分に有力な掲載候補です。ディレクトリ利用者がインストール判断に必要な実用情報を得られるだけのワークフロー内容があり、DiffDockによるタンパク質-リガンドドッキングを明確に対象としているうえ、バッチ処理と単一複合体の両方に対応し、さらに補助スクリプトや参考ドキュメントも揃っているため、単なる汎用プロンプトよりも判断材料が豊富です。

78/100
強み
  • 用途が明確:frontmatterと概要で、PDB/SMILES入力による拡散モデルベースの分子ドッキング向けスキルだと明示されています。
  • 実運用の流れを支援:リポジトリには3つのスクリプトに加え、バッチ用CSVや推論設定テンプレートが含まれており、入力準備と出力解析を進めやすくなっています。
  • ガイドの深さが十分:参考ドキュメントでパラメータ、ワークフロー、使用例、信頼度と制約をカバーしており、導入判断のしやすさと実行時の分かりやすさが高まります。
注意点
  • SKILL.mdにはインストールコマンドがないため、利用者はリポジトリ内の手順よりも参照先ワークフローをもとにセットアップを推測する必要があります。
  • このスキルはポーズ予測と信頼度評価に特化しており、結合親和性の予測は対象外です。結合エネルギー推定を求める場合は別のツールが必要になります。
概要

diffdock skillの概要

diffdockは何のためのものか

DiffDockは、タンパク質構造または配列とリガンド入力から、タンパク質-リガンド結合ポーズを予測するドッキング特化のskillです。結合親和性の推定よりも、「この化合物はどこに、どのように結合しそうか」を実用的に知りたいときに、diffdock skillを使います。

最適な用途と判断の境界

構造ベース創薬、バーチャルスクリーニング、後続解析のためのポーズ生成に向いています。一方で、効力順のランキングだけが必要な場合、標的タンパク質が非常に柔軟な場合、あるいはポーズ予測ではなく一般的な化学ワークフローを求めている場合は、適合度が下がります。

何が便利なのか

diffdockの主な価値は、単一複合体のドッキング、バッチスクリーニング、信頼度スコアリング、配列ベースのタンパク質入力を1つのワークフローにまとめて扱えることです。実行可能なドッキング手順と、スコアを読み違えないための十分な指針の両方が欲しいときに、diffdockの導入価値が高くなります。

diffdock skillの使い方

インストールしてワークフローを確認する

Claude skillsの設定にdiffdock skillをインストールしたら、まず SKILL.md を開きます。その後、実行前に references/workflows_examples.mdreferences/parameters_reference.mdreferences/confidence_and_limitations.md を読み、実際の入力形式、デフォルト値、スコアの解釈を把握してください。

タスクをそのまま使えるプロンプトに落とし込む

diffdockを使うときは、タンパク質の形式、リガンドの形式、ジョブ種別を最初に明示します。良い入力は具体的です。たとえば「このSMILESをこのPDBにドッキングして、上位5件のポーズと信頼度の解釈を返して」や「このリガンド群を1つの受容体に対してバッチドッキングして」のようにします。逆に「diffdockを実行して」だけでは不十分です。ファイルを使うのか、配列を使うのか、CSVバッチなのかが分からないからです。

適切なファイルと出力を使う

単発ドッキングでは、まずタンパク質PDBと、SMILES、SDF、MOL2のいずれかのリガンドを用意します。バッチ処理では assets/batch_template.csv のCSVテンプレートを使い、実行前の検証が必要なら scripts/prepare_batch_csv.py を確認します。実行後は scripts/analyze_results.py を使うと、ポーズ順位と信頼度スコアを要約できるため、出力ファイルを1つずつ手で確認せずに済みます。

実務上のセットアップのコツ

diffdockのインストールと初回実行は、モデル重みの取得やルックアップテーブル生成で遅くなることがあります。セットアップコストを見込んで計画してください。タンパク質に構造がない場合は、配列ベースのfoldingも使えますが、その分不確実性が増します。実験構造がないときの代替手段として使い、デフォルトの近道にしないのが基本です。サンプリング設定の調整は難しいタスクのときだけにしてください。サンプル数を増やせば探索範囲は広がりますが、計算量と後処理の負荷も増えます。

diffdock skillのFAQ

diffdockはPDBファイル専用ですか?

いいえ。diffdock skillはタンパク質構造を扱えますし、ワークフローによっては、ドッキング前にfoldingするタンパク質配列もサポートします。ただし、PDBがあるならそれを使うのが最善です。配列から生成した構造は、誤差要因がさらに1つ増えるからです。

diffdockは親和性を予測しますか?

いいえ。DiffDockが予測するのは結合ポーズと信頼度であり、結合親和性ではありません。親和性に近い優先順位付けが必要なら、confidenceを効力の代わりに扱うのではなく、diffdockにスコアリングまたは再スコアリングの工程を組み合わせてください。

diffdock skillは初心者向けですか?

はい。ただし、1受容体・1リガンド・1つのポーズ問題のように、タスクが素直な場合に限ります。バッチキュレーション、柔軟なタンパク質、低confidenceサンプルの慎重な解釈が必要になると難しくなります。dockingの入門としては使いやすいですが、専門的な判断の代わりにはなりません。

どんなときは使わない方がいいですか?

結合の主因がコンフォメーション変化にある標的や、リガンド表現が非常に不確かな場合には、diffdockに頼らないでください。真に知りたいのがSAR、選択性、ADMETであれば、完全なメディシナルケミストリー解析の代替にもなりません。

diffdock skillを改善する方法

より良い分子コンテキストを与える

diffdockで最も良い結果が出やすいのは、入力がきれいなときです。正しい受容体ファイル、既知のプロトン化状態の前提を持つリガンド、そして結合問題の明確な定義が揃っているのが理想です。結合部位が分かっているならそれを明示してください。ブラインドドッキングならその点も伝えてください。探索戦略も、想定されるconfidenceも変わるからです。

実際に使う出力を指定する

diffdockの使い勝手は、上位1件のポーズが欲しいのか、上位5件なのか、バッチスクリーニングなのか、confidence順の候補が欲しいのかを明示すると大きく改善します。後で結果比較をするなら、ファイル名の統一ルールと要約表も指定してください。曖昧さが減り、Data Analysisやスクリーニングレポートへの組み込みがしやすくなります。

よくある失敗パターンに注意する

よくあるミスは、confidenceをaffinityと取り違えること、リガンド前処理が不十分なこと、そしてモデルが得意でないタンパク質に対する実行結果を過信することです。結果が不安定なら、サンプル数を増やして再実行し、上位ポーズを複数比較し、問題がモデルではなくリガンド化学やタンパク質状態にあるかを確認してください。

具体的なフォローアッププロンプトで反復する

初回実行のあと、次のdiffdockプロンプトは「部位の配置が悪い」「ポーズのクラスタリングが不安定」「confidenceスコアが低い」といった具体的な問題に基づいて改善します。一般的な再実行を頼むより、その方がずっと有効です。diffdockをData Analysisに使う場合は、抽出したい指標を明示してください。たとえば、順位分布、スコア閾値、複合体ごとの要約などです。

評価とレビュー

まだ評価がありません
レビューを投稿
このスキルの評価やコメントを投稿するにはサインインしてください。
G
0/10000
新着レビュー
保存中...