pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill pymc

編集スコア

このスキルの評価は84/100で、ディレクトリ利用者向けの掲載候補として十分に有力です。ベイズモデリングのタスクに明確に反応し、インストールを正当化できるだけのワークフロー情報も備えていますが、補助ファイルや導入を後押しする構成があるとさらによくなります。

84/100

強み

PyMC 5.x+ を前提に、階層モデル、NUTSサンプリング、変分推論、モデル比較まで含めてベイズモデリング用途が明確に絞られている。
実務面の案内がしっかりしており、データ準備、サンプリング、検証、診断、モデル比較まで、標準的なベイズワークフローを本文で追える。
具体的なユースケースとコード例があるため、汎用的なプロンプトよりも迷いが少なく、エージェントで扱いやすい。

注意点

インストールコマンドや補助スクリプト、参考資料がないため、利用者は `SKILL.md` の内容だけに依存することになる。
リポジトリは長めの単一スキルファイル中心に見えるため、高度なケースや例外的な導入では手作業での調整が必要になる可能性がある。

Python Pymc Bayesian Modeling Probabilistic Programming Mcmc Variational Inference Statistics Arviz

概要

pymc skill の概要

pymc は、Python でベイズモデリングを行い、確率モデルの構築・推定・診断・比較まで進めるための skill です。単なる点予測ではなく、不確実性をきちんと見積もりたいときに向いています。たとえば、階層回帰、多層分析、時系列、欠損データ、測定誤差、そして LOO や WAIC を使ったモデル比較に適しています。

pymc は何のための skill か

pymc skill は、雑多なデータを「説明責任のあるベイズモデル」に落とし込みたいときに使います。汎用的な Python 解析スクリプトを書くためのものではありません。
「この効果を不確実性つきで推定したい」という曖昧な要望を、実際に動く PyMC モデル、サンプリング計画、検証ワークフローへとつなげるのに役立ちます。

どんな人に向いているか

この pymc skill は、目的変数と説明変数は分かっているものの、モデルの表現をどう組むべきかで迷いやすいデータアナリスト、研究者、ML 実務者に向いています。
特に、事前分布の選び方、サンプラーの不調の切り分け、事後分布の診断結果の読み解きといった、ベイズワークフロー上の判断が必要な場面で力を発揮します。

主な差別化ポイント

単なるプロンプトと比べて pymc が有用なのは、データ準備、モデル定義、サンプリング、チェック、比較までの一連の流れを軸にしているからです。
実務上の利点は、PyMC プロジェクトでつまずきやすい NUTS、事前予測チェック、収束診断まわりの試行錯誤を減らせることです。

pymc skill の使い方

pymc skill をインストールする

skill ファイルに記載されたリポジトリコマンド、または利用中のプラットフォームの skill インストーラを使って、skills ディレクトリに pymc skill をインストールします。
そのうえで scientific-skills/pymc のパスが利用可能になっていることを確認し、最初に SKILL.md を開いてください。そこに、想定されるベイズワークフローと適用範囲が定義されています。

ざっくりした目的を、使えるプロンプトに言い換える

「この dataset を pymc で分析して」のような弱い依頼だと、前提が足りません。
より良いプロンプトでは、必要なモデルの種類、目的変数、ありそうな説明変数、データ量、グルーピング構造、そして分析で何を得たいかを具体的に書きます。たとえば次のようにします。
「ユーザー別・campaign 別の conversion を対象に、pymc で階層ロジスティック回帰を構築し、弱情報事前分布を入れ、サンプリング診断の見方を説明し、プールドモデルとの比較方法も示してください。」

リポジトリで最初に読むべき場所

まず SKILL.md を開き、その後は skill を使う条件と標準的なベイズワークフローを説明している箇所に注目してください。
実装寄りの作業なら、モデルコードを書かせる前に、データ準備、モデル構築、サンプリング、事後チェックの例を先に読んでおくと精度が上がります。

出力をよくするワークフロー上のポイント

pymc では、入力データの形が非常に重要です。変数型、グルーピング ID、欠損の有無、すでに済ませたスケーリングやカテゴリ変換があれば、その情報を必ず含めてください。
初稿以上のモデルが欲しいなら、事前分布、サンプラー設定、診断出力まで明示的に依頼するとよいです。Data Analysis 用の pymc では、さらに解釈、予測、因果比較、意思決定支援のどれを重視するかも指定してください。そこによって適切なモデル構造が変わります。

pymc skill の FAQ

pymc は上級者向けだけですか？

いいえ。データを明確に説明でき、モデル診断を確認する意欲があるなら、初心者でも pymc skill は使えます。
難しいのは構文よりもモデリング上の判断であることが多いため、構造設計や検証のガイドが欲しいときに特に役立ちます。

pymc を使わないほうがよいのはどんなときですか？

簡単な記述統計の図、単純な頻度論的検定、不確実性を考えなくてよいブラックボックス予測だけが目的なら、pymc は向きません。
また、データ生成過程をまったく説明できない場合も相性が悪いです。PyMC は、モデル仮定を明示できるときに最も力を発揮します。

pymc は汎用の prompt と何が違いますか？

汎用 prompt でもコードは出せますが、pymc はベイズワークフローと、モデル品質を左右する典型的な失敗点に焦点を当てています。
そのため、場当たり的な prompt よりも、事前分布の質、サンプリング方針、診断への配慮が得られやすくなります。

pymc は Python エコシステムに合いますか？

はい。pymc は Python の分析スタック、とくに NumPy、pandas、ArviZ、関連する可視化・前処理ツールと連携しやすい設計です。
すでに Python で分析しているなら、pymc は確率的モデリングの自然な選択肢です。

pymc skill の改善方法

モデルの前提をもっと具体的に伝える

pymc の出力を改善する最善の方法は、最初にモデルの種類を明示することです。線形、ロジスティック、階層、時系列、欠損データ、測定誤差のどれなのかをはっきり書いてください。
加えて、目的変数、説明変数、グループ水準、そしてモデル設計に影響すべき業務上または科学上の制約も入れると精度が上がります。

コードだけでなく診断も依頼する

pymc の失敗原因は、弱い事前分布、スケーリング不良、サンプラーの病的挙動にあることが少なくありません。
事前予測チェック、事後予測チェック、effective sample size、R-hat、divergences、そしてサンプリングが苦戦したときに何を変えるべきかの方針まで求めてください。そうすると、検証が重要な Data Analysis で pymc skill がより実用的になります。

データ形状と比較条件を具体的に伝える

最初の結果を有益なものにしたいなら、行数、数値変数とカテゴリ変数の区別、反復測定やクラスターの有無を伝えてください。
モデル比較が必要なら、ベースラインモデルと、「より良い」の意味を明示してください。そうすれば、pymc skill は LOO や WAIC を適切な文脈で扱えます。

最初のフィット結果をもとに反復する

最初の実行後は、ゼロから新しいモデルを頼むのではなく、実際の trace の問題、posterior plot、divergence 数をフィードバックしてください。
pymc を最速で改善する方法は、仮定を一つずつ詰めることです。入力をスケールし、事前分布を強めるか緩めるかを調整し、階層構造を単純化してから再フィットし、比較してください。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0

scvelo

作成者 K-Dense-AI

scvelo は、単一細胞 RNA-seq データにおける RNA velocity 解析のための Python スキルです。未スプライス／スプライス済み mRNA から細胞状態遷移を推定し、軌道の方向性を推論し、latent time を算出し、driver genes を特定するのに使えます。標準的なクラスタリングや pseudotime だけでは方向性が足りない Data Analysis での scvelo に特に有用です。

Data Analysis

お気に入り 0GitHub 0