lamindb

作者 K-Dense-AI

lamindb 技能可帮助你使用 LaminDB —— 一个开源的生物学数据框架，让数据可查询、可追溯、可复现并符合 FAIR 原则。它适用于 lamindb 的数据分析、元数据整理、基于本体的注释、schema 验证，以及贯穿 notebooks 和 pipelines 的可追踪工作流。

Stars0

收录时间2026年5月14日

分类数据分析

安装命令

npx skills add K-Dense-AI/claude-scientific-skills --skill lamindb

编辑评分

该技能评分为 78/100，是 Agent Skills Finder 中一个相当稳妥的候选条目。目录用户可以看到足够证据，说明它可用于 LaminDB 相关的生物数据管理任务；而且这份内容结构完整、篇幅较长，相比通用提示词更能减少误判。不过，它更适合作为一个聚焦的专业技能，而不是带有完整安装支持、开箱即用的工作流方案。

78/100

亮点

生物数据工作流的触发范围很清晰：明确提到了 scRNA-seq、空间组学、流式细胞术、lineage tracking、本体和可复现性。
操作内容充实：技能正文篇幅较大、结构清楚，并包含多个标题和代码块，说明它更像真实工作流指南，而不是空壳模板。
对处理生物数据基础设施的 agent 很有安装决策价值：描述把 LaminDB 与可查询性、可追溯性、FAIR 合规以及工作流/MLOps 工具集成联系起来。

注意点

没有安装命令或配套文件，用户无法依赖仓库自动化或辅助参考资料快速接入。
仓库证据体现了广度，但缺少足够的配套文件或脚本，无法验证这些工作流端到端到底有多可执行、可测试。

Python Biology 科学数据集 Data Engineering Data Validation Data Quality 可重复性

概览

lamindb 技能概览

lamindb 是做什么的

lamindb 技能帮助你使用 LaminDB——一个开源的生物学数据框架，用来让数据集可查询、可追踪、可复现，并符合 FAIR 原则。当你需要的不只是文件存储，而是希望整理生物数据、附加元数据和本体（ontology）术语，并保留从原始输入到分析输出的完整谱系时，就该使用 lamindb 技能。

适合这类工作流

如果你的团队要处理 scRNA-seq、空间转录组、流式细胞术或其他必须保持可搜索、可审计的研究数据，这个技能非常适合。尤其是在你的 lamindb 使用场景涉及数据整理、schema 校验、生物注释，或将分析运行与下游结果关联起来时，它会特别有用。

为什么用户会安装它

大多数用户安装 lamindb，是因为他们需要一种实用方式来减少数据混乱，而不必自己发明一套自定义追踪系统。它的核心价值不只是存储，而是让数据能在 notebooks、pipeline 和协作研究工作流中真正可用。

如何使用 lamindb 技能

安装并查看正确的文件

使用以下命令安装 lamindb 技能：
npx skills add K-Dense-AI/claude-scientific-skills --skill lamindb

然后先从 scientific-skills/lamindb/SKILL.md 入手。如果你需要更广的上下文，只有在仓库里确实存在 README.md 时才去看它；否则应把重点放在技能文件本身，以及其中链接的示例或代码块上。这个仓库看起来没有提供辅助脚本或支持目录，所以技能文件是主要信息来源。

把模糊目标改写成有用的提示词

想让 lamindb usage 产生强结果，最好一开始就说明三件事：数据类型、预期工作流阶段，以及你想要的输出。比如，不要只说“帮我处理 lamindb”，而是可以问：“给我一个用于 scRNA-seq 元数据追踪的 LaminDB 方案，需要基于本体的细胞类型标签和支持谱系安全版本管理。”这样技能才有足够上下文，输出更接近可直接决策的结果。

按正确顺序阅读仓库

最快的方式是先读 SKILL.md，然后跳到与你任务匹配的部分：概览、“when to use”、核心概念，以及任何工作流或部署指导。如果文件里有代码块，要把它们当成最具体的实现线索，并结合你自己的项目进行适配，而不是原样照抄。

把它用于工作流设计，而不只是语法

lamindb 指南最有价值的地方，不在于告诉你怎么调用 API，而在于帮你决定该如何建模数据。典型的好用场景包括：规划元数据字段、选择本体术语、判断什么算一个数据集版本，以及定义如何在 notebooks 或 pipeline 步骤之间捕获谱系信息。

lamindb 技能常见问题

lamindb 只适合生物团队吗？

是的，lamindb 技能主要面向生物和生物医学数据工作流。如果你的项目不依赖样本元数据、基于本体的注释，或可复现研究谱系，那么一个通用的数据管理提示词可能更合适。

我必须已经在用 LaminDB 吗？

不需要，初学者也可以使用 lamindb 技能。但如果你能清楚描述数据结构和研究工作流，通常会得到更好的结果。如果你是在评估一个新项目的 lamindb install，建议先从一个小而明确的数据集或 pipeline 开始，而不是一开始就设计完整平台。

lamindb 比普通提示词强在哪？

普通提示词可以解释概念，但 lamindb 技能更适合在真实约束下做实现选择。它在你需要兼顾谱系、FAIR 元数据、本体用法，以及生物数据操作的实际形态时，会更有帮助。

什么情况下不该用它？

如果你的问题主要是通用分析、简单文件整理，或者非生物类应用数据，就不要用 lamindb。只有当可追踪性、语义化元数据和可复现性确实是需求的一部分时，这个技能才最有价值。

如何改进 lamindb 技能

把必须做出的决策告诉技能

更好的 lamindb 结果，来自告诉它你需要做什么决策，而不只是你正在构建什么。请说明你是否需要 ingestion、注释、校验、谱系追踪，或者与 Nextflow、Snakemake 等工具集成，因为这些都会导向不同的 lamindb usage 模式。

提供具体的数据示例

分享一小段列名、本体术语、文件类型和版本规则的样例。比如，“samples 有 donor_id、tissue、cell_type、assay 和 batch”就比“我有 omics 数据”更有操作性。具体输入能改善 schema 建议，并减少抽象层级不匹配的问题。

警惕过度泛化

常见失败模式之一，是把每个数据集都当作需要同等结构化程度来处理。如果第一版输出太宽泛，就让 lamindb 技能收窄到一个数据集类别、一个 pipeline 步骤，或一种注释标准，然后再逐步迭代。

迭代成可落地的仓库方案

如果第一轮答案偏概念化，就继续追问一个可直接用于仓库的计划：要存什么、实体怎么命名、要校验什么，以及接下来该看 SKILL.md 的哪一部分。这样就能把 lamindb guide 变成一份可执行的搭建清单，而不只是高层摘要。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0