scanpy

作者 K-Dense-AI

用于 Python 中单细胞 RNA-seq 数据分析的 scanpy 技能。适合做 QC、标准化、PCA、UMAP/t-SNE、聚类、marker 基因发现、轨迹分析以及生成出版级图表。最适合围绕 AnnData 构建的探索性 scRNA-seq 工作流，提供清晰的 scanpy 使用与安装指引。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

编辑评分

该技能得分 78/100，说明它很适合作为目录用户的候选条目，尤其适合想直接获得现成 Scanpy 工作流、而不是泛用提示词的用户。仓库展示了一个内容充实、非占位的单细胞 RNA-seq 技能，具有明确的使用场景、具体的工作流步骤，以及足够的结构，能帮助代理更少依赖猜测地触发并应用它。

78/100

亮点

明确覆盖标准 scRNA-seq 任务，如 QC、标准化、PCA/UMAP/t-SNE、聚类、marker 基因和轨迹分析。
SKILL.md 内容较为充实，包含有效 frontmatter、较长正文、多个标题和代码示例，支持实际使用。
包含使用边界和相关技能建议，帮助代理在探索性单细胞分析场景中优先选择 Scanpy，并将深度学习或 AnnData 特定问题交给其他工具。

注意点

未提供安装命令、支持文件或外部引用，因此实际采用主要依赖书面技能说明。
该仓库看起来是纯文档型，用户应预期获得的是工作流指导，而不是打包好的自动化能力或经过测试的脚本。

Scanpy Python 科学 Single Cell 生物信息学基因组学 Jupyter

概览

scanpy 技能概览

scanpy 是做什么的

scanpy 技能用于 Python 中的单细胞 RNA-seq 分析：质量控制、归一化、特征选择、PCA、UMAP/t-SNE、聚类、marker 发现，以及轨迹式探索分析。它最适合你已经有了，或者能够创建 AnnData 对象，并且想要一份面向 Data Analysis 的实用 scanpy 指南，而不是深度学习模型工作流。

谁适合使用它

如果你在处理 scRNA-seq 数据，把原始计数转换成可分析对象，或者准备用于解读和发表的图表与聚类注释，就适合使用 scanpy 技能。它面向的是想要标准探索性流程、并且明确需要 scanpy 安装和用法步骤的分析人员，而不是通用生信入门读物。

它的不同之处

这个仓库聚焦的是常见的 Scanpy 工作流，而不是泛泛的理论概览：数据加载、预处理、嵌入、聚类和可视化。它也把边界划得更清楚——如果你需要深度生成模型，应该看 scvi-tools；如果你的核心问题是 AnnData 结构或文件格式，anndata 才是更好的起点。

如何使用 scanpy 技能

安装并验证该技能

按照常规目录工作流安装 scanpy 技能，然后在提问前先打开技能文件：

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

安装完成后，先阅读 scientific-skills/scanpy/SKILL.md，再继续看文件里链接到的相关部分。这里没有额外的辅助脚本或参考目录，所以技能文本本身就是主要依据。

给模型提供可直接分析的输入

最有效的 scanpy 提示，会明确数据形状、格式和目标。要写清楚输入是 .h5ad、10X 输出，还是计数矩阵；有多少样本或批次；是否需要 QC 阈值、整合、聚类或绘图；以及你希望得到什么输出。低质量提示会说“分析我的 scRNA-seq 数据”；更好的提示会说“用 scanpy 加载两个 10X 数据集，过滤低质量细胞，归一化，计算 PCA/UMAP，多分辨率聚类，并为每个 cluster 找 marker genes”。

按实用工作流推进

对大多数任务，建议按这个顺序处理：加载数据，检查 obs/var，过滤低质量细胞和基因，归一化/对数变换，选择高变基因，标准化并运行 PCA，构建邻近图，计算 UMAP，聚类，然后排序 marker 或可视化基因集。如果你已经有处理好的 AnnData，要明确说明；这样可以避免技能重复基础设置步骤，把输出集中在尚未完成的分析决策上。

先读对的部分

先从 SKILL.md 顶部开始，再跳到涵盖设置、加载、预处理、绘图和下游分析的使用章节。如果仓库提到了特定输入格式或约定，就在提示词里严格对齐这些要求。目标是在模型写代码或分析步骤之前，尽量减少猜测。

scanpy 技能常见问题

scanpy 只适用于 scRNA-seq 吗？

是的，主要是如此。scanpy 技能的重点是单细胞转录组工作流，尤其是基因表达矩阵的探索性分析。它并不适合 bulk RNA-seq，也不适合那些更适合用专门单细胞深度学习工具完成的建模任务。

如果我已经会提示模型，还需要这个技能吗？

如果你已经完全掌握工作流和对象结构，直接提问可能就够了。scanpy 技能更适合你想要一条一致的分析路径、减少遗漏步骤，并且希望在 QC、预处理、聚类和可视化上有更稳妥默认值的时候。

它适合新手吗？

从流程标准、且技能聚焦于实用 scanpy 用法这个意义上说，它对新手是友好的。不过它仍然默认你理解基本的 Python、单细胞概念，以及原始计数、归一化数据和带注释元数据之间的区别。

什么时候不该用它？

如果你的问题主要是文件转换、AnnData schema 设计，或者构建用于细胞状态推断的神经网络模型，就不要把 scanpy 当作主技能使用。在这些场景里，换别的技能或工具，通常比强行让 scanpy 覆盖整个流程更有效。

如何改进 scanpy 技能

提供会改变决策的输入

提升质量最大的做法，是说明数据集大小、物种、平台、批次结构，以及你当前处在分析的哪一步。对于 scanpy 用法，还要写明是否存在 ambient RNA 问题、是否需要去除 doublet，或者是否已经有一组已知 marker genes，因为这些细节会直接影响 QC 和解读。

要结果，不只是步骤

不要只问“scanpy analysis”，而要明确你要的交付物：预处理 notebook、聚类工作流、marker-gene 表，或者包含 UMAP 和 violin plots 的绘图代码块。清晰的输出目标有助于模型选择合适的 scanpy 指南结构，也能避免对你不需要的基础内容过度解释。

注意常见失败模式

最常见的问题是跳过 QC 背景、把原始层和归一化层混用、在检查 neighbors 和 scaling 选择之前就做聚类，以及在没有明确生物学问题的情况下要求出结果。如果第一次生成太泛，就用准确的输入对象、变量名，以及你希望分析支持的决策来重写提示。

每次只增加一个约束

第一版之后，改进 scanpy 技能输出的最好方式，是一次只加一个约束：h5ad only、避免 integration、生成 publication-quality plots，或者在 obs 中保留 batch labels。通常这比大范围重写更有效，因为它能保持工作流稳定，同时收紧对你的 scanpy for Data Analysis 任务真正重要的部分。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0