scikit-learn

作成者 K-Dense-AI

scikit-learn は、Python で古典的な機械学習ワークフローを構築するのに役立ちます。この scikit-learn スキルでは、分類、回帰、クラスタリング、前処理、モデル評価、ハイパーパラメータ調整、パイプラインを扱えます。表形式データで再現性の高いモデル開発を進めるための、実用的な scikit-learn ガイドです。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill scikit-learn

編集スコア

このスキルのスコアは 79/100 で、ディレクトリ利用者向けの掲載候補として十分有力です。scikit-learn の実務的なワークフロー価値があり、運用面の案内もあるため役立ちますが、単独のインストール判断ページとしてはまだ完成度に余地があります。

79/100

強み

起動条件が明確です。説明文で分類、回帰、クラスタリング、次元削減、前処理、評価、ハイパーパラメータ調整、パイプラインまで具体的に触れており、呼び出し判断に使いやすいです。
運用上の分かりやすさがあります。本文にインストールコマンドと明確な「When to Use This Skill」セクションがあり、エージェントがいつ使うべきか判断しやすくなっています。
ワークフローの厚みがあります。リポジトリには見出し、コードフェンス、repo/file 参照を含む大きく構造化された本文があり、プレースホルダーではなく再利用可能なガイドとして機能することがうかがえます。

注意点

サポートファイルや補助的な参照は含まれていないため、利用者は主に SKILL.md の内容に依存することになります。
リポジトリのプレビューには制約や利用ガードレールが見当たらず、境界的な判断はエージェント側に残る可能性があります。

Python Scikit Learn Pandas Matplotlib Seaborn

概要

scikit-learn スキルの概要

この scikit-learn スキルでできること

scikit-learn スキルは、Python での古典的な機械学習ワークフロー構築を支援します。分類、回帰、クラスタリング、次元削減、前処理、評価、パイプラインまでをまとめて扱えます。単なるライブラリ要約ではなく、データ課題を実際に動くモデルへ落とし込むための実用的な scikit-learn guide を求める人に最適です。

データ分析での最適な使いどころ

この scikit-learn skill は、表形式データや軽く構造化されたデータに対して、信頼できる scikit-learn for Data Analysis を必要とするときに向いています。特に、素早いベースライン、解釈しやすいモデル、再現可能な評価を重視する場合に強みがあります。アルゴリズム比較を行い、保守しやすい形で成果物を出したいアナリスト、ML エンジニア、データサイエンティストにとって相性のよいスキルです。

何が優れているのか

最大の価値は、ワークフローの見通しがよくなることです。特徴量の準備、リークの回避、推定器の選定、パラメータ調整、評価方法の統一をどう進めるかが明確になります。汎用プロンプトと比べて、scikit-learn スキルは前処理の順序、train/test split、パイプライン設計に関する迷いを減らすことを目的としています。

scikit-learn スキルの使い方

スキルをインストールして読み込む

GitHub でホストされているこのようなスキルは、Claude の skills 設定にインストールし、まず scientific-skills/scikit-learn/SKILL.md を開いてください。リポジトリのワークフローに組み込む場合は、プロンプトやコードを書く前に、同じファイル内のリンク先セクションもあわせて確認するとよいです。

実際の機械学習タスクとして依頼する

良い入力は、目的、データの形、制約を具体的に示します。たとえば「30 列の表形式データから解約を予測したい。数値とカテゴリが混在し、クラス不均衡がある。cross-validation で AUC を評価し、前処理込みの pipeline で出力してほしい」といった依頼です。単に「scikit-learn を手伝って」と言うより、こちらのほうが、推定器、評価指標、変換処理をすぐ選びやすくなります。

先に読むべき部分を絞る

まずインストール手順と「使うべき場面」のガイダンスを確認し、そのあと必要なワークフローに直接進みます。前処理、モデル選定、評価、ハイパーパラメータチューニングなどです。タスクが曖昧なら、まずベースラインの pipeline を提案させ、そのうえで実際のデータスキーマと成功指標に合わせて詰めていくのが有効です。

実践的なプロンプトの型

プロンプトには、目的変数、特徴量の種類、データ量、欠損の有無、クラスバランス、評価指標、そして code が欲しいのか、説明が欲しいのか、デバッグしたいのかを入れてください。例: 「欠損値と one-hot encoding がある 50k 行の回帰用 scikit-learn pipeline を作成して。Ridge、RandomForestRegressor、HistGradientBoostingRegressor を 5-fold CV で比較し、簡潔な Python のみ返してほしい。」

scikit-learn スキル FAQ

scikit-learn は自分のタスクに合っていますか？

構造化データに対する古典的な ML、強いベースライン、明確な評価ループを求めるなら scikit-learn を選びます。深層学習、大規模分散学習、エンドツーエンドの feature store オーケストレーションが中心なら、このスキルは主役としては合わないかもしれません。

scikit-learn を事前に知っている必要はありますか？

いいえ。scikit-learn skill は、問題は理解していても API の細部はまだ分からない初心者にも役立ちます。特に、自分のデータと目的を明確に説明できるようになるほど価値が高まり、適切な推定器や pipeline の形を提案してもらいやすくなります。

普通のプロンプトより何が良いのですか？

普通のプロンプトだと、リーク対策、分割戦略、前処理の順序が抜け落ちがちです。焦点を絞った scikit-learn guide なら、その一連の流れをまとめて扱えるため、一回きりの notebook スニペットではなく、再現性のある scikit-learn usage を求める場面で役立ちます。

使わないほうがいいのはどんなときですか？

主にニューラルネットワーク、非構造化な画像・音声生成、あるいは PyTorch や TensorFlow が必要な独自の training loop が中心なら、使わないほうがよいです。scikit-learn が最も強いのは、解決策を組み合わせ可能な estimator pipeline として表現できる場合です。

scikit-learn スキルを改善するには

目的だけでなくデータの詳細を渡す

最良の結果を出すには、列の種類、欠損状況、ターゲットの型、クラス不均衡、サンプル数といった具体的な入力が欠かせません。「数値 8 列、カテゴリ 6 列の二値分類で、陽性率 12%、precision を固定したうえで recall を最大化したい」といった依頼のほうが、「精度を上げたい」よりも、よりよい scikit-learn usage につながります。

評価の形を明示する

ホールドアウト分割、cross-validation、時系列を考慮した validation、grouped split のどれが必要かを明示してください。これで設計が大きく変わり、scikit-learn スキルが、性能を水増ししたり情報漏えいを起こしたりする悪いデフォルトを避けやすくなります。

まずベースラインを出してから詰める

最初は、前処理つきのシンプルな pipeline、1〜2 個の候補モデル、明確な指標を依頼します。その結果を見てから、feature selection を追加する、hyperparameter を調整する、不均衡データに対処する、解釈性を優先してモデルを単純化する、といった形で詰めていくとよいです。

よくある失敗を避ける

典型的なミスは、前処理の不一致、pipeline の外で欠損処理をしてしまうこと、そしてビジネス目標に合わない指標を使うことです。出力を改善するときは、pipeline ベースの解法、指標をそのように選ぶ理由、各データ変換に置いた前提を明示的に求めてください。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0