shap

用于模型可解释性和可解释 AI 的 shap 技能。可用来理解预测结果、计算特征归因、选择 SHAP 图表，并调试 Data Analysis 中树模型、线性模型、深度学习模型和黑盒模型的行为。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill shap

编辑评分

该技能得分 78/100，说明它是目录用户的一个稳妥候选：仓库提供了足够真实的 SHAP 工作流指导，足以支持安装决策，但还没有到开箱即用、完全无摩擦的程度。这个技能的目标很明确，就是解释性任务；相较于通用提示词，它能让代理更少猜测地触发并执行与 SHAP 相关的工作。

78/100

亮点

触发性强：frontmatter 和概览明确提到 SHAP、特征重要性、预测解释、偏差/公平性分析以及多种图表类型。
工作流内容扎实：SKILL.md 正文篇幅较大，包含很多标题和工作流/约束信号，说明它不是占位符或演示文档。
对代理更友好：覆盖多类模型，代理可将该技能应用于树模型、深度学习、线性模型和黑盒模型。

注意点

没有安装命令或配套文件，用户可能需要仅根据文档自行推断安装和使用细节。
仓库看起来是纯文档型，实际执行支持可能依赖代理已有的工具链以及对 SHAP 库的知识。

Python Plotly Matplotlib Seaborn

概览

shap 技能概览

shap 的作用

shap 技能可以帮助你用 SHAP values 解释模型预测结果，让你看清楚哪些输入把预测推高了，哪些输入把预测拉低了。它最适合需要模型可解释性、特征归因，或用于真实分析而不是泛泛“特征重要性”概览的 explainable AI 工作流用户。

这个技能适合什么场景

当你需要回答这些实际问题时，适合使用 shap 技能：为什么会出现这个预测、哪些特征最关键、模型是否表现公平、以及如何向相关方给出可信的解释。它适用于树模型、线性模型、深度学习模型，以及许多黑盒模型。

用户通常最关心什么

大多数安装 shap 的人，最在意的是能否快速走通输出路径：该选哪个 explainer、explainer 需要什么数据、以及哪种图最符合当前问题。这个技能的价值在于它聚焦的是解释工作流，而不只是库的 API。

如何使用 shap 技能

安装并找到核心说明

按照目录里的常规技能安装流程安装 shap 技能，然后先打开 scientific-skills/shap/SKILL.md。如果这个包以后加入了链接上下文，再检查 README.md、AGENTS.md、metadata.json，以及任何 rules/、resources/ 或 references/ 目录；但目前这个 repo 的工作流核心仍集中在 SKILL.md。

把模糊需求改成可执行的提示词

shap 技能在提示词里写清楚模型类型、预测任务、要解释的数据切片和分析目标时，效果最好。比如不要只说“对我的模型用 shap”，而是明确提出：针对二分类器做 SHAP 解释、输出单个预测的 top features、给验证集做全局 summary、以及为选定行生成 waterfall plot。

提供 SHAP 真实需要的输入

高质量的 shap 使用通常依赖背景数据、一个具体的预测行或样本集，以及准确的模型对象或预测函数。你如果只给模型名字而没有数据上下文，输出就会差很多。请补充特征名、预处理细节、类别标签，以及任何已知约束，比如缺失值或类别编码方式。

按正确顺序阅读工作流

先看概览和“何时使用”的指导，再进入 explainer 选择步骤和绘图示例。为了判断质量，要特别注意那些关于 explainer 类型与模型家族匹配的说明，因为选错 explainer 是 SHAP 输出变慢、噪声变大或产生误导的最常见原因。

shap 技能常见问题

shap 比普通提示词更好吗？

通常是的，前提是你需要的是一套可重复的可解释性工作流。普通提示词可以描述 SHAP，但 shap 技能会更结构化地指导你选择合适的 explainer、准备输入，以及正确解读结果。

shap 对新手友好吗？

对基础查看来说是友好的，尤其是特征重要性和单次预测解释。若你想解释交互、比较模型，或排查预处理问题，它就没那么适合新手，因为这些任务高度依赖良好的数据准备。

什么时候不该用 shap？

如果你只需要一个简单的模型分数，或者只想要一个笼统的“为什么会这样”答案，却拿不到模型和数据，就不该用 shap。若你的解释必须在超大规模下极快完成、且无法承受局部解释的额外开销，它也不是最佳选择。

安装 shap 前应该检查什么？

先确认你的环境能运行你想解释的模型，并且你有具代表性的背景数据。对于 shap for Data Analysis 来说，最大的阻碍通常不是库本身，而是不完整的输入上下文。

如何改进 shap 技能

给它更准确的问题切片

最好的 shap 结果来自窄而可验证的请求：一个模型、一个任务、一个数据切片、一个解释目标。如果你要求“所有 SHAP 图”，通常比你明确要求“全局排序用 beeswarm，再给一个高风险预测做 waterfall plot”得到的输出更弱。

补充会改变解释结果的细节

要说明模型家族、目标类型、特征预处理，以及你想要局部还是全局解释。这些细节会影响 explainer 的选择，也会影响 SHAP values 的解读方式。比如树模型和神经网络往往需要不同的配置，而经过编码的特征可能还需要映射回人类可读的特征名称。

注意最常见的失败模式

shap 使用中的主要失败模式，是背景数据不匹配、解释了变换后的特征却没有映射回原始含义，以及为错误的问题选了错误的图。如果第一次结果看起来不对，就把提示词改成更精确的行索引、类别名、预处理流水线，以及你真正想回答的业务问题。

从解释走向决策

拿到第一版输出后，再继续追问下一步解释：比较两个样本、检查交互效应，或者用通俗语言总结最主要的驱动因素。这是把 shap 从可视化工具转成实用分析工作流、用于模型调试和向相关方汇报的最快方式。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0