molfeat

作成者 K-Dense-AI

molfeat は、ML とデータ分析向けの分子特徴量化スキルです。SMILES や RDKit 分子を、QSAR、仮想スクリーニング、類似検索、化学空間解析に使えるフィンガープリント、記述子、事前学習済み埋め込みへ変換するのに役立ちます。この molfeat ガイドを使えば、実務で使いやすい表現を選び、再利用しやすい特徴量化パイプラインを構築できます。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill molfeat

編集スコア

このスキルの評価は 78/100 で、Agent Skills Finder に掲載する候補として十分に有力です。リポジトリの記述から、分子特徴量化タスクでエージェントが呼び出せること、目的をすばやく把握できること、そして単なるプロンプト以上の実運用上の価値があることが読み取れます。一方で、導入時に必要な細かな情報はまだ一部不足しています。

78/100

強み

トリガー条件が明確で、分子特徴量化、QSAR/QSPR、仮想スクリーニング、類似検索、SMILES から特徴量への変換に直接対応している。
運用面の情報量が豊富で、本体は 14k 文字超、見出しも多く、実際に使えるガイダンスとして十分な厚みがある。
導入方法と機能の説明が具体的で、100 種類以上の featurizer を挙げ、インストールコマンドや特定モデル群向けの追加依存関係のバリエーションも示している。

注意点

リポジトリのスナップショットには埋め込みスクリプト、参考資料、サポートファイルが含まれていないため、ユーザーは実行可能な補助資産なしで説明文を信頼する必要がある。
抜粋ではインストール手順は確認できるものの、提供された証拠内でエンドツーエンドのクイックスタートが完全には見えていないため、境界ケースではユーザー側の解釈が必要になる可能性がある。

Python Scikit Learn Machine Learning Chemistry Dataset Bioinformatics

概要

molfeat skill の概要

molfeat skill でできること

molfeat skill は、分子を機械学習用の特徴量に変換するのに役立ちます。QSAR、QSPR、バーチャルスクリーニング、類似性検索、化学空間解析のために、実用的な molfeat ガイドを求めている人に最適です。場当たり的な特徴量コードを書く代わりに、SMILES や RDKit の分子オブジェクトを数値ベクトル、fingerprint、descriptor、学習済み埋め込みへ標準的に変換できます。

どんな人に向いているか

Data Analysis のために分子機械学習を行う人、featurization パイプラインを組み立てる人、モデル間で表現の選択肢を比較したい人は molfeat skill を使うとよいでしょう。scikit-learn 風の transformer、並列処理、キャッシュを、各 featurizer を手作業で組み合わせずに使いたいときに特に便利です。

何が違うのか

molfeat の主な価値は、対応範囲の広さと一貫性にあります。多数の featurizer を 1 つのライブラリにまとめ、入力形式を統一し、出力を下流の ML ワークフローにそのまま載せやすくしています。一方で、タスクに合う表現を自分で選ぶ必要は残りますし、埋め込みの一部は追加オプションに依存します。fingerprint が 1 つだけ欲しいなら、素直な RDKit スクリプトのほうが簡単なこともあります。ですが、さまざまな分子タイプに対して再現性のある特徴量生成が必要なら、molfeat のほうが適しています。

molfeat skill の使い方

molfeat をインストールし、必要な extras を追加する

多くの人にとって molfeat install の流れはシンプルです。まず基本パッケージを入れ、その後で実際に使う featurizer に必要な extras だけを追加します。よくある起点は次のとおりです。

uv pip install molfeat
# or, if you need broader support
uv pip install "molfeat[all]"

ワークフローが graph model、学習済み言語モデルの埋め込み、特定の backend に依存するなら、パイプラインを設計する前にその optional dependency を確認してください。

まずは今ある入力から始める

この skill は、分子の形式、タスク、出力の形を最初に明確にすると最もよく機能します。たとえば、1 列の SMILES、RDKit molecule のリスト、欲しい fingerprint の系統、下流モデルの種類などが有効な入力です。たとえば「50k の SMILES を scikit-learn の分類モデル向けに、キャッシュ可能な Morgan fingerprints に変換したい」は、「これらの化合物を featurize して」よりずっと具体的です。

先に読むべきファイルを絞る

この repo では、まず SKILL.md と installation セクションを読み、そのあと overview と “When to Use This Skill” の案内を確認してください。そこを押さえると、対応しているワークフロー、必要な dependency、重要になりやすい featurizer の系統を最短で把握できます。repo がコンパクトなので、主な判断材料は補助ファイルを探すことではなく、fit と dependency を理解することにあります。

実用的な prompt パターン

molfeat usage のワークフローを呼ぶときは、タスク、分子ソース、希望する表現、制約を含めてください。強い依頼例は次のようになります。「assay CSV に SMILES があり、QSAR 向けに再現性のある featurization 手順が必要です。scikit-learn 互換を優先し、ECFP、MACCS、物理化学 descriptor を比較したいです。」これなら、意図を推測させるのではなく、妥当な進め方を選びやすくなります。

molfeat skill FAQ

molfeat は化学情報学の専門家だけのものですか？

いいえ。molfeat skill は、分子と予測目的を説明できれば、初心者にも使いやすいです。難しいのは構文ではなく、データセットとモデルに合う表現を選ぶことです。

どんなときに molfeat を使わないほうがいいですか？

単一の簡単な descriptor だけが必要な場合や、ワークフロー自体が分子 Data Analysis ではない場合は、molfeat を見送ってよいでしょう。featurization だけでなく、完全な学習パイプラインまで欲しいなら、より適した選択肢になることもあります。

一般的な prompt と何が違いますか？

一般的な prompt は fingerprint の理屈を説明できても、molfeat は分子特徴量、キャッシュ、transformer ベースのワークフローを実際に使うための具体的な install-and-use の流れを示せます。これは、概念的な説明だけでなく、実際のモデリングにそのまま使える出力が必要なときに重要です。

導入が進みにくい主な原因は何ですか？

主な障害は、optional dependency の不足、入力形式の不明確さ、タスクに対して featurizer が過剰に複雑なことです。SMILES か RDKit オブジェクトのどちらを使うのか、classical descriptor が必要なのか学習済み埋め込みが必要なのかを分かっていれば、導入はかなり楽になります。

molfeat skill の改善方法

分子の文脈をもっと詳しく伝える

molfeat の結果を改善する最も強い方法は、分子ソース、batch size、最終的な用途を明示することです。たとえば「assay CSV 由来の SMILES、20k 行、binary classification、random forest 用にコンパクトな features が必要」は、「features を作って」よりずっと実行可能な指示です。

重要な制約をはっきり伝える

速度、メモリ、再現性、モデル互換性を重視するなら、はっきり書いてください。そうした制約によって、molfeat の最適解が単純な fingerprint になるのか、descriptor セットになるのか、追加 dependency を伴う学習済み埋め込みになるのかが変わります。

表現を選ぶときは比較を依頼する

どの表現を使うべきか迷うなら、単独の答えではなく横並びの推奨を求めてください。たとえば「計算資源が限られた小規模 QSAR データセットで、ECFP、MACCS、学習済み埋め込みを比較してほしい」です。こうした prompt なら、最終的なモデル品質に影響する tradeoff を説明しやすくなります。

まずはベースラインから反復する

まずは 1 つの安定した featurization を試し、出力形状と欠損値の扱いを確認してから、別の候補へ広げてください。実際には、最も早く改善する方法は、まずシンプルな molfeat パイプラインで動作確認を行い、そのベースラインが通ってから caching、batching、より豊かな特徴セットへ進むことです。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0