ab-test-analysis

作者 phuryn

ab-test-analysis 帮助你以统计学严谨性评估 A/B 测试结果，包括样本量校验、置信区间、显著性检验，以及上线/延长/停止建议。可用于实验复盘、split test 解读和 Data Analysis 工作流中的决策支持。

Stars11k

收录时间2026年5月8日

分类数据分析

安装命令

npx skills add phuryn/pm-skills --skill ab-test-analysis

编辑评分

该技能得分 78/100，说明它很适合作为目录中的候选条目：目标明确指向 A/B 测试分析，工作流细节也足够，能减少试探成本；对于需要实验结果解读支持的 agent 来说，具备安装价值，但尚未完整配备支持文件或安装说明。

78/100

亮点

明确给出了 A/B 测试分析、显著性检查、样本量校验以及上线/停止建议等触发语义。
操作流程清晰，包含理解实验、验证设置和计算统计显著性的步骤。
正文内容充实（3232 字符），并提供了具体统计公式和代码块用法，相比泛泛的提示词，更能给 agent 提供可执行的指导。

注意点

没有提供安装命令或配套参考文件，因此实际采用时可能需要用户直接检查 SKILL.md。
内容中带有实验/测试性质的信号，仓库也缺少外部验证资产，因此更适合当作聚焦型工具使用，而不是高度完备支持的包。

分析统计学 CSV XLSX Python 实验设计

概览

ab-test-analysis 技能概览

ab-test-analysis 的作用

ab-test-analysis 技能帮助你用严谨的统计方法评估实验结果，再把数字转化成可执行的上线、延长或停止决策。它面向那些不满足于只看提升幅度的人：ab-test-analysis 不只是判断变体有没有“赢”，还会检查这个测试本身是否设置得足够可靠，结果值不值得信。

适合谁用

如果你在产品、增长、数据分析或实验平台相关岗位，需要一种可复用的 A/B 测试复盘方式，那么这个 ab-test-analysis skill 很适合你。对于 ab-test-analysis for Data Analysis 这类场景，尤其适用于解读转化数据、验证显著性，并把结论清楚地传达给非技术干系人。

它解决什么问题

真正要完成的任务，是判断一个结果能不能用于决策。ab-test-analysis 能帮助你做样本量校验、置信区间分析、显著性检验和 guardrail 检查，避免把误导性的结果直接上线，或者对噪声过度反应。

为什么值得安装

ab-test-analysis 的核心价值在于提升决策质量。它的设计目标是直接读取实验输入，支持基于文件的分析，并基于实验卫生标准给出建议，比如测试时长、随机分流和统计功效。如果你需要的是一份实用而不是纯理论的 ab-test-analysis guide，这个技能很合适。

如何使用 ab-test-analysis 技能

安装并定位该技能

通过 repo 命令运行 ab-test-analysis install 流程：
npx skills add phuryn/pm-skills --skill ab-test-analysis

安装完成后，先打开 SKILL.md。在这个仓库里，这个文件包含实际使用说明，也是了解 ab-test-analysis usage 路径时信号最强的来源。

在提示词里要提供什么

这个技能最适合在你给出实验上下文时使用，而不只是丢一堆原始数字。请包含假设、control 和 variant 的定义、主指标、guardrail、流量分配、测试时长，以及你手头的任何数据文件。一个较好的提示词示例如下：

“请分析这个关于结账按钮颜色的 A/B 测试。主指标是购买转化率，guardrail 是退款率，流量分配为 50/50，测试运行了 14 天，我附上了 CSV 导出文件。请检查样本量、SRM、置信区间，并给出 ship/extend/stop 建议。”

实际工作流程

先从结果文件入手，再确认实验设置，然后请求统计解读，最后才让它给出决策。这个顺序很重要，因为 ab-test-analysis 的设计目的，就是在你接受 uplift 之前先识别样本功效不足、随机分流异常和时序问题。

先读哪些文件和线索

这个仓库结构很精简，所以应优先查看 SKILL.md。如果目录后续扩展，优先关注 README.md、AGENTS.md、metadata.json、rules/、resources/、references/ 或 scripts/ 这些目录，因为它们最可能包含工作流约束、示例或计算辅助工具。

ab-test-analysis 技能 FAQ

ab-test-analysis 只适用于转化测试吗？

不是。它最常用于转化率实验，但只要你需要对两个变体做对比，并输出主指标、置信区间和决策建议，ab-test-analysis skill 都会很有用。若任务只是描述性汇报、没有实验设计，它的价值就会小很多。

我需要统计学背景吗？

不需要太多。这个技能对初学者很友好，因为它能帮你把分析结构搭起来，并把结果解释清楚。不过，ab-test-analysis 最适合的前提仍然是你能提供干净的输入，并能回答关于假设、指标和测试设计的基本问题。

它和普通提示词有什么不同？

普通提示词通常会直接跳到显著性判断。ab-test-analysis 则提供了更完整的流程：先核验实验设置，再检查样本量和时长，排查 SRM 或新颖性效应，最后再计算并解释结果。这个额外结构通常比一次性的分析提示词更容易得到更好的决策。

什么情况下不该用它？

如果你只需要仪表盘文案、营销写作，或者一份不需要统计判断的报告，就不该用 ab-test-analysis。当数据集不完整，且你无法识别 control、variant、指标或测试窗口时，它也不合适。

如何改进 ab-test-analysis 技能

给技能更完整的实验上下文

提升质量最大的方式，就是提供更强的输入。请包含假设、具体改动、分群定义、指标公式、持续时间以及任何排除条件。如果这些信息缺失，ab-test-analysis 仍然可能算出数字，但它给出的建议会更弱，因为它无法判断测试设计是否真的支撑这个结果。

以最适合分析的形式提供数据

如果你有 CSV 或导出文件，尽量提供按单元划分的逐行数据，或者分析所需的汇总计数。这个技能可以直接读取数据文件，所以请尽量给它既保留隐私又保留结构的最原始版本。能给表格就尽量不要给图表截图，因为表格更有利于做显著性和样本检查，也更可靠。

提出你真正需要的决策

最好的 ab-test-analysis usage 应该是围绕决策来组织的。不要只问“这个显著吗？”，而是直接问“给出 ship、extend 还是 stop，并说明理由和 caveats。”这样输出会更贴近业务动作，而不只是统计结果。

第一轮之后继续迭代

如果第一次分析显示功效不足、SRM 异常，或者 guardrail 指标出现混杂变化，就应补充更多上下文再重新提问，而不是硬逼它得出结论。常见的改进包括补充预先计算好的计数、澄清主指标，或者要求按分群或时间窗口拆分结果。这样通常是为你的具体实验拿到更好的 ab-test-analysis guide 的最快方式。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0