pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill pymc

编辑评分

该技能得分为 84/100，说明它是目录用户的一个稳妥候选：它对贝叶斯建模任务有明确触发性，并提供了足够的工作流细节，足以支持安装决策，不过如果能补充支持文件和更偏落地的脚手架会更好。

84/100

亮点

明确聚焦 PyMC 5.x+ 的贝叶斯建模，包括分层模型、NUTS 采样、变分推断和模型比较。
操作指引扎实：正文梳理了标准贝叶斯工作流，涵盖数据准备、采样、验证、诊断和模型比较。
对代理执行更友好，也更清晰：具体用例和代码示例比泛泛的提示词更能减少猜测成本。

注意点

没有安装命令，也没有支持脚本/参考资料/资源，因此用户只能依赖 SKILL.md 的内容。
该仓库看起来主要围绕一个较长的技能文件展开，因此某些高级或边缘场景的接入路径可能仍需要手动调整。

Python Pymc 贝叶斯建模概率编程 MCMC 变分推断统计学 ArviZ

概览

pymc 技能概览

pymc 是一款用于构建、拟合、检查和比较概率模型的贝叶斯建模技能，适合在 Python 中做真正的“不确定性估计”，而不只是给出点预测。它尤其适合层级回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 做模型比较等场景。

pymc 适合做什么

当你的任务是把杂乱数据整理成一个站得住脚的贝叶斯模型，并完成后验推断，而不是写一段通用的 Python 分析脚本时，就该用 pymc 技能。它能帮助你从“我想在不确定性下估计这个效应”推进到可运行的 PyMC 模型、采样方案和验证工作流。

适合使用 pymc 的人群

pymc 适合数据分析师、科学研究人员和 ML 从业者——他们通常已经知道因变量和自变量是什么，但需要帮助把模型表达得更准确。它对贝叶斯工作流中的决策尤其有用：如何选择先验、排查采样器问题、解读后验诊断结果。

主要差异点

和普通提示词相比，pymc 的价值在于它把完整工作流放在中心位置：数据准备、模型设定、采样、检查和比较。实际优势是，在 NUTS、先验预测检查和收敛诊断这些 PyMC 项目里常见的卡点上，能少很多试错。

如何使用 pymc 技能

安装 pymc 技能

根据技能文件里给出的仓库命令，或你所用平台的技能安装器，把 pymc 技能安装到你的 skills 目录中。然后确认 scientific-skills/pymc 路径可用，并先打开 SKILL.md，因为这个文件定义了预期的贝叶斯工作流和适用范围。

把模糊目标改写成有效提示词

像“用 pymc 分析这个数据集”这种弱请求，留下了太多未说明的信息。更好的提示词应该明确：你需要什么类型的模型、响应变量是什么、可能的预测变量有哪些、数据量多大、是否存在分组结构，以及你希望分析输出什么。比如：“为用户和 campaign 的转化率建立一个 pymc 分层逻辑回归，加入弱信息先验，解释采样诊断，并展示如何与 pooled model 比较。”

仓库里先看什么

先从 SKILL.md 开始，然后重点看那些说明何时使用该技能以及标准贝叶斯工作流的部分。如果你的任务偏实现，先读数据准备、模型构建、采样和后验检查附近的示例，再让模型开始写代码。

能显著提升输出质量的工作流细节

对于 pymc 来说，输入数据的形状非常重要。请提供变量类型、分组 ID、缺失情况，以及已经做过的缩放或类别编码。如果你想要的不只是一个初稿，请明确要求先验、采样器设置和诊断输出。对于 pymc for Data Analysis，还要说明你想要的是解释、预测、因果比较，还是决策支持，因为这些目标会对应不同的模型结构。

pymc 技能 FAQ

pymc 只适合高级用户吗？

不是。只要能把数据描述清楚，并愿意查看模型诊断，初学者也可以使用 pymc 技能。更难的通常是建模判断，而不是语法，因此当你需要结构设计和验证方面的指导时，这个技能最有价值。

什么时候不该用 pymc？

如果你只需要一张快速的描述性图表、一个简单的频率学派检验，或者一个不要求不确定性的黑箱预测，就不要用 pymc。还有一种不适合的情况是，你根本无法描述数据生成过程；因为 PyMC 最适合的是模型假设明确的场景。

pymc 和普通提示词有什么不同？

普通提示词也许能生成代码，但 pymc 更强调贝叶斯工作流以及影响模型质量的常见失败点。通常这意味着它会给出更好的先验建议、更好的采样建议，并且比临时拼凑的提示词更重视诊断。

pymc 适配更广泛的 Python 生态吗？

可以。pymc 的设计就是为了配合 Python 分析栈使用，尤其是 NumPy、pandas、ArviZ，以及相关的绘图和数据准备工具。如果你的分析流程本来就在用 Python，pymc 会是做概率建模的自然选择。

如何改进 pymc 技能

提供更明确的模型上下文

提升 pymc 输出质量最有效的方法，是一开始就说清楚模型类型：线性、逻辑回归、层级模型、时间序列、缺失数据，还是测量误差模型。还要补充目标变量、预测变量、分组层级，以及应该影响模型设计的业务或科研约束。

要求诊断，不只要代码

很多 pymc 失败都来自先验太弱、缩放不当，或者采样器路径问题。请明确要求先验预测检查、后验预测检查、有效样本量、R-hat、divergences，以及采样吃紧时该如何调整。这样 pymc 技能在需要验证的 Data Analysis 工作中会更有用。

提供数据形状和比较目标

如果你想要一个有价值的初步结果，请告诉模型有多少行、哪些变量是数值型或类别型，以及是否存在重复测量或聚类结构。如果你还需要模型比较，请明确基线模型，以及你所说的“更好”具体指什么，这样 pymc 技能才能合理地组织 LOO 或 WAIC。

用第一次拟合结果继续迭代

拿到第一轮结果后，把实际的 trace 问题、后验图或 divergence 数量反馈回来，而不是重新从头请求一个全新的模型。改进 pymc 的最快方式，是一次只调整一个假设：先缩放输入，再收紧或放宽先验，然后简化层级结构，最后重新拟合并比较。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0

scvelo

作者 K-Dense-AI

scvelo 是一款用于单细胞 RNA-seq 数据中 RNA velocity 分析的 Python 技能。可用它根据未剪接和已剪接 mRNA 估计细胞状态转变、推断轨迹方向、计算 latent time，并识别 driver genes。对于需要超越标准聚类或 pseudotime、进一步判断方向性的 Data Analysis 场景，scvelo 尤其有用。

数据分析

收藏 0GitHub 0