geniml

作者 K-Dense-AI

geniml 是一个用于 BED 文件、scATAC-seq 输出和染色质可及性数据的基因组区间机器学习技能。可用于 Region2Vec、BEDspace、scEmbed、consensus peaks 以及其他面向区域的 ML 工作流。若你需要基因组区域的 embeddings、聚类或预处理建议，它是一个合适的选择。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill geniml

编辑评分

该技能评分为 78/100，说明它是目录用户的一个不错候选：它的基因组区间 ML 范围清晰，工作流具体，也有足够的操作细节支撑安装决策，但与封装更完整的技能相比，仍存在一定的配置与落地空缺。

78/100

亮点

明确覆盖 BED/基因组区间 ML 任务的触发场景，包括 Region2Vec、scEmbed、universes 和 consensus peaks。
包含较丰富的工作流内容，有多个标题、代码块以及 repo/file 引用，比泛泛的提示更便于代理执行。
提供安装命令和清晰的包身份，方便用户判断它是否适配自己的基因组数据工作流。

注意点

未包含 scripts、references、resources 或 rules 文件，因此代理可能需要仅根据正文推断部分实现细节。
该技能指向 GitHub 安装路径和 Python 包安装，但没有专门的快速上手或验证清单来减少配置上的试错。

Python 基因组学生物信息学 Bed Single Cell Machine Learning Scikit Learn

概览

geniml 技能概览

geniml 的用途

geniml 技能帮助你把基因组区间数据作为机器学习输入来处理，尤其适用于 BED 文件、scATAC-seq 输出以及染色质可及性区域。它最适合那些需要把原始基因组区间转成 embedding、聚类或其他可直接用于 ML 的特征，而不只是做注释或可视化的读者。

什么时候适合用

当你的任务是构建区域表示、比较区间集合、定义 consensus peaks，或者对区间集合做下游建模时，使用 geniml 技能会更合适。它尤其适用于以 Region2Vec、BEDspace、scEmbed 和基于 universe 的 peak 处理为核心的 geniml for Data Analysis 工作流。

安装前最该确认什么

最关键的判断点是：你需要的是专门面向基因组区间的 ML 工作流，而不是一个通用的 Python 提示词。如果你的任务只是过滤 BED 文件、调用 peaks，或者做标准的生物信息学 QC，那么 geniml 大概率过于专用；如果你需要 embeddings 或 region-level 的 ML 特征，那么 geniml install 就很值得。

如何使用 geniml 技能

安装技能并确认包路径

先用你的 agent 环境里的项目 skill manager 安装这个技能，然后把工作流指向仓库路径 scientific-skills/geniml。安装完成后，先确认 geniml 技能已经可用，再去撰写依赖它的提示词。

先读对文件

先从 SKILL.md 开始，再查看它指向的安装说明、核心能力和你真正需要的方法。在这个仓库里，没有额外的 scripts/、rules/ 或 resources/ 文件夹，所以主要价值就在技能正文本身和其中嵌入的链接。

给模型正确的输入形状

一个高质量的 geniml 提示词，应该说明你手里是什么类型的区间、它们是什么格式，以及你想要什么输出。比如：“用 geniml 技能把这些 BED 文件转换成用于聚类的 region embeddings，并告诉我哪些预处理假设最重要。”这比“分析我的基因组数据”更好，因为它给了技能一个明确目标。

更实用的工作流，才能得到更好的输出

使用 geniml usage 时，可以按三步来组织：先定义区间来源，再选择方法，最后限定结果。记得包含物种、文件数量、区域定义，以及你要的是 embeddings、consensus peaks 还是 cell-level 表示。如果任务涉及机器学习依赖，尽早说明，这样输出才能把 geniml[ml] 和 PyTorch 风格的环境配置考虑进去。

geniml 技能常见问题

geniml 只适合 BED 文件吗？

基本上是。geniml 技能的重点是基因组区间，因此 BED 文件和相关的区域表格是最自然的输入。如果它也能处理其他输入，那通常只是附带能力；如果你的数据并不是基于区间的，别的工具往往更合适。

用它需要机器学习经验吗？

不需要，但你需要有明确目标。只要能用自然语言说清楚数据是什么、想得到什么结果，初学者也可以使用 geniml 指南。难点不在语法，而在于选对区域学习工作流。

geniml 和普通提示词有什么不同？

普通提示词通常是在要一个通用解释。geniml 技能更适合需要工作流级指导的场景，比如如何准备区间数据、该选哪一类模型，以及哪些假设会影响后续的 embeddings 或聚类。对可复现分析来说，这会更有用。

什么时候不该用 geniml？

不要把 geniml 用在简单的 BED 编辑、基因组浏览器任务，或者与区间无关的机器学习问题上。如果你并不是想从基因组区域中学习表示，这个技能只会增加流程负担，收益不大。

如何改进 geniml 技能

明确分析目标

提升 geniml 输出最快的方法，就是直接点明具体任务：Region2Vec embeddings、BEDspace 比较、scEmbed 分析，还是 universe 构建。技能知道你要的是相似性、聚类、cell-level 特征还是 consensus 区域时，表现会更好。

先给出数据约束

一开始就告诉模型你有多少个文件、这些区间来自 bulk 还是 single-cell 数据，以及这些区域是固定宽度还是可变宽度。这些信息会改变预处理选择，也能帮助 geniml 技能避免给出空泛建议。

要工作流，不只是结果

一个好的 geniml usage 请求，应该同时问步骤、必需输入和常见坑。比如：“展示用 geniml 从 BED 文件训练 embeddings 的指南，并说明训练前需要标准化哪些内容。”这样得到的输出，比只要一句话总结更可操作。

根据具体方法反馈继续迭代

如果第一次回答太宽泛，就进一步收窄，要求它给出具体方法和缺失的决策点。对于 geniml for Data Analysis，通常就是把 universe 选择、tokenization 假设、embedding 目标，以及是否需要先安装 ML 依赖这些问题说清楚。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0