gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill gget

编辑评分

该技能评分为 85/100，属于目录中相当值得收录的候选项。仓库提供了足够真实的工作流内容，足以支撑安装判断：它明确面向快速的生物信息学检索，同时展示了 CLI 和 Python 两种用法，并说明了可预期的输出和参数，因此代理在触发时比面对泛化提示更容易判断何时调用。

85/100

亮点

安装与使用场景明确，覆盖 20+ 个生物信息学数据库，包括基因信息、BLAST、AlphaFold 结构、富集分析和疾病关联。
操作层面的说明比较清晰：技能文档给出了统一的 CLI/Python 模式、常见参数以及输出格式（JSON/CSV、DataFrame/dict）。
具备较好的采用信号：frontmatter 有效、没有占位符标记、正文篇幅充足，并明确说明模块会每两周针对数据库变化进行测试。

注意点

摘录内容没有展示完整的模块级工作流，因此某些任务仍可能需要深入查看该技能文档。
摘录中的安装命令看起来有些不规范或重复（如 'uv uv pip' 以及用于 pip 的 'uv pip'），如果不先修正，可能会拖慢首次安装。

Python Cli 生物信息学基因组学科学 Jupyter 数据库分析

概览

gget 技能概览

gget 的作用

gget 是一款生物信息学技能，可通过命令行或 Python 快速、统一地访问 20 多个基因组数据库和分析工具。它适合需要基因查询、BLAST 相关检索、AlphaFold 结构检查、表达数据、疾病关联以及富集类分析的人，而不必把多个独立 API 拼接在一起。

适合谁使用

gget 技能最适合研究人员、生物信息学分析师，以及正在做探索性数据分析或轻量级流水线步骤的 AI agent。它适用于你想要快速得到答案、需要一致的接口，并且希望同一工具既能在 CLI 中使用，也能在 Python 工作流中使用的场景。

它为什么更突出

gget 的核心价值是访问速度，而不是深度的流水线编排。当任务横跨多个公开生物资源、而你又希望用一个工具以可复现的方式统一查询时，它就很有用。如果你需要重型批处理或更高级的 BLAST 控制，仓库本身会建议你转向更专门的替代方案，比如 Biopython；如果你要的是更广泛的多数据库 Python 工作流，bioservices 可能更合适。

如何使用 gget 技能

安装 gget 技能

在你的 skills 环境中使用以下命令安装：

npx skills add K-Dense-AI/claude-scientific-skills --skill gget

如果是本地 Python 使用，建议先创建一个干净的环境，避免数据库依赖和包依赖与其他科学工具发生冲突。

先阅读正确的文件

先从 SKILL.md 开始，然后查看你复制到工作区中的 README.md（如果存在），以及任何 AGENTS.md、metadata.json、rules/、references/、resources/ 或 scripts/ 目录。对于这个仓库来说，核心指导集中在 scientific-skills/gget/SKILL.md，因此没必要去到处寻找并不存在的辅助文件。

把模糊目标改写成可用提示词

一个好的 gget 提示词会明确写出生物实体、目标数据库和你想要的输出格式。比如：“Use gget to find gene summary, aliases, and related expression information for TP53, then return a compact table I can paste into a report.” 这比“look up TP53”更强，因为它告诉技能要检索什么，以及结果该如何组织。

实用工作流建议

把 gget 用在定向查询和探索性步骤上，等你需要可追踪结果时再保存输出。尽量一次只提一个清晰的模块请求，尤其是在你重视可复现性，或者需要对比不同数据库输出的时候。如果你在做 gget for Data Analysis，尽早要求表格化输出，这样结果后续才能被检查、筛选或合并。

gget 技能常见问题

gget 主要是给 CLI 还是 Python 用的？

两者都可以。gget 技能既支持命令行工具，也支持 Python 函数，所以具体选哪种方式，取决于你是在交互式探索，还是把查询嵌入 notebook 或脚本中。

什么时候 gget 很适合？

当你需要快速访问整理过的生物数据源时，gget 技能很合适，尤其适用于以基因为中心的研究、结构检查或轻量级富集问题。当问题更像是“抓取并检查”，而不是“搭建并管理完整分析流水线”时，它尤其合适。

什么时候不该用 gget？

如果你需要大规模批处理、高级 BLAST 参数控制，或者更通用的多 API 集成层，就不建议用 gget。这些情况下，仓库自己的说明会把你引向更专门的工具。

gget 适合新手吗？

适合，只要任务简单而且边界清楚。新手通常最适合从单个基因、单个数据库问题和明确的输出格式开始，而不是一上来就试图把所有东西都查一遍。

如何改进 gget 技能

给 gget 更多生物学上下文

gget 最强的结果来自具体输入：基因符号加物种、蛋白 ID 加结构问题，或者通路术语加你需要的证据类型。比起“Find information on BRCA1”，“Summarize BRCA1 human gene aliases, disease links, and expression-related records for a literature note” 更有效，因为它给出了更明确的目标和范围。

明确告诉它你需要什么输出形式

如果你是把 gget 用于 Data Analysis，就要说明你需要 JSON、CSV，还是适合直接放进表格的摘要。这能减少后续清理工作，也能帮助技能生成更便于样本间对比、或者合并进 notebook 的结果。

注意数据库和版本漂移

仓库说明提到，上游数据库会变化，而 gget 会以每两周一次的更新节奏跟进这些变化。如果某个查询失败，或者返回结构和预期不一样，先缩小查询范围再试，并检查是不是上游源格式变了，而不要先假定是技能本身坏了。

从第一轮结果继续迭代

先用第一轮答案来收窄下一步提示：只有在看到初始输出之后，再要求相关基因、不同数据库视图，或者更严格的过滤条件。对于 gget skill 的使用来说，这种分步推进通常比一次塞进太多生物学问题的超大请求更容易得到干净结果。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0

scvelo

作者 K-Dense-AI

scvelo 是一款用于单细胞 RNA-seq 数据中 RNA velocity 分析的 Python 技能。可用它根据未剪接和已剪接 mRNA 估计细胞状态转变、推断轨迹方向、计算 latent time，并识别 driver genes。对于需要超越标准聚类或 pseudotime、进一步判断方向性的 Data Analysis 场景，scvelo 尤其有用。

数据分析

收藏 0GitHub 0