pydeseq2

作者 K-Dense-AI

pydeseq2 是一个面向 bulk RNA-seq 差异基因表达分析的 Python DESeq2 技能。可用于比较不同条件、拟合单因素或多因素设计、执行 Wald 检验和 FDR 校正，并在 pandas 和 AnnData 工作流中生成火山图或 MA 图。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

编辑评分

该技能得分 80/100，值得收录。仓库提供了足够的证据，说明目录用户和代理都能判断何时使用它、按真实的 PyDESeq2 差异表达流程执行，并且比泛化提示更少猜测。它并非包装得最完善，但包含较完整的操作内容，对做 bulk RNA-seq 分析的用户具有明确的安装与使用价值。

80/100

亮点

触发性强：frontmatter 和 “When to Use This Skill” 明确指向 DESeq2、差异表达、bulk RNA-seq 计数和 PyDESeq2。
操作流程完整：技能正文包含基于 pandas、DeseqDataSet、DeseqStats、过滤、Wald 检验和 FDR 校正的具体快速上手步骤。
对代理很友好：覆盖单因素和多因素设计、batch/covariate 处理、apeGLM shrinkage，以及 pandas/AnnData 集成。

注意点

未提供安装命令或支持文件，因此用户可能需要自行推断环境/安装细节。
仓库带有实验/测试信号，并且看起来只是一个没有参考资料或辅助资产的单独 SKILL.md。

Python Pandas 生物信息学基因组学数据集

概览

pydeseq2 技能概览

pydeseq2 适用于什么

pydeseq2 是一个用于 bulk RNA-seq 计数数据差异基因表达分析的 Python 技能。它可以帮助你从原始计数和样本元数据出发，得到差异表达结果、fold change、校正后 p 值，以及火山图和 MA 图等常见探索性输出。

适合谁使用

如果你想在 Python 里做 DESeq2 风格分析、需要多因素设计，或者希望把差异表达分析无缝接入 pandas/AnnData 工作流，就适合使用 pydeseq2 技能。它更适合已经手头有计数矩阵以及临床或实验元数据的分析人员，而不是想要一整套 RNA-seq 预处理流水线的用户。

它的价值在哪里

pydeseq2 的核心价值在于，它为原本可能要转去 R 才能做 DESeq2 的 Python 用户减少了迁移成本。它支持 Wald 检验、多重检验校正、可选的 apeGLM shrinkage，以及适合在 notebook 或 pipeline 中复现的工作流。

如何使用 pydeseq2 技能

安装 pydeseq2

先把该技能安装到你的 Claude skill 集中，然后在提问前打开技能文件：
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

在决定是否安装和配置 pydeseq2 时，先确认你的环境里已经有 RNA-seq 计数表、样本元数据，以及你的工作流所需的 Python 包。这个技能最适合你能提供“样本 × 基因”的计数数据，并且已经有设计公式或分组变量的场景。

从正确的输入开始

高质量的 pydeseq2 使用，首先取决于输入结构是否清晰：

计数矩阵：样本作为行，基因为列
按 sample ID 索引的元数据
明确的 condition 列，以及你想纳入模型的 batch 或协变量列
明确的比较目标，例如 treated vs control

低质量的提问会说：“帮我对 RNA-seq 数据做差异表达分析。”
更好的提问会说：“请用 pydeseq2 分析一个 bulk RNA-seq 计数矩阵，24 个样本，比较 treated vs control，把 batch 作为协变量，过滤掉极低计数基因，并返回显著基因以及火山图/MA 图代码。”

先读这些文件

先从 SKILL.md 入手，了解工作流和预期分析步骤。然后再查看 README.md、AGENTS.md、metadata.json，以及仓库中可能存在的 rules/、resources/、references/ 或 scripts/ 文件夹。对这个仓库来说，最关键的实践信息在 SKILL.md 里，所以不要默认还会有额外的辅助文件。

正确使用 pydeseq2

把 pydeseq2 当作一种分析方法，而不只是代码生成器。你需要明确告诉模型：

你的物种和实验类型
样本如何分组
你需要单因素还是多因素设计
你是否需要 shrinkage、排序或可视化
你需要什么输出格式，例如 dataframe、notebook cells，或可复用脚本

这样可以明显提升 pydeseq2 的使用效果，因为模型能据此选择合适的设计、过滤和解释步骤，而不是靠猜。

pydeseq2 技能常见问题

pydeseq2 只适合 DESeq2 用户吗？

不是。任何想在 Python 里做 DESeq2 风格差异表达分析的人都可以用。对于已经在 pandas、scanpy 或 AnnData 里工作的用户，它尤其有用，因为你可以把分析留在同一技术栈里完成。

使用它一定要写出完美提示词吗？

不需要，但过于模糊的提示词通常只会得到泛化的分析代码。pydeseq2 技能在你提供计数表形状、关注的比较，以及已知混杂因素时，效果最好。

pydeseq2 适合新手吗？

如果你已经理解 RNA-seq 计数和实验设计的基本概念，它对新手是友好的。若你还需要在差异表达之前处理比对、定量或上游 QC，那么它就不太合适。

什么情况下不该用 pydeseq2？

不要把它用于单细胞差异表达、没有原始计数的标准化表达分析，或者需要完整端到端转录组流水线的工作流。如果你真正需要的是统计解释而不是基因层面的计数数据，它也不是合适选择。

如何改进 pydeseq2 技能

给出更好的生物学背景

最好的 pydeseq2 结果，来自能说明研究设计的提示词，而不只是文件名。请补充响应变量、对照条件、批次效应、重复数，以及你是否需要基因排序、绘图代码或结果解释。

明确你关心的分析决策

告诉技能如何处理低计数基因、是否使用多因素模型，以及是否需要对效应量做 shrinkage。这些选择会实质性影响 pydeseq2 的输出，也能避免走默认流程而得到并不适合你研究的结果。

让输出可以直接复用

不要只问“给我结果”，而是要一个可保存的 dataframe schema、绘图片段，或者可直接放进 notebook 的工作流。例如：“返回 pydeseq2 代码，完成模型拟合、提取校正后 p 值，并把显著基因及其 log2 fold change 和 padj 写入 CSV。”

从诊断开始迭代，而不只是盯最终命中

如果第一次运行结果不对劲，优先让它做 QC 相关检查：样本聚类、计数过滤依据、保留下来的基因数，或者设计公式是否存在混杂。这是在结果偏弱或异常稀疏时，改进 pydeseq2 for Data Analysis 的最快办法。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0