作者 Shubhamsaboo
data-analyst 是一个轻量级 GitHub skill,用于引导代理通过 SQL、pandas 和基础统计分析来完成数据探索。它尤其适合希望仅通过一层 `SKILL.md` 提示,就获得有代码支撑的查询、数据转换与结果解读的用户。
作者 Shubhamsaboo
data-analyst 是一个轻量级 GitHub skill,用于引导代理通过 SQL、pandas 和基础统计分析来完成数据探索。它尤其适合希望仅通过一层 `SKILL.md` 提示,就获得有代码支撑的查询、数据转换与结果解读的用户。
作者 wshobson
data-quality-frameworks 技能可帮助团队使用 dbt tests、Great Expectations 和 data contracts 规划生产环境数据校验。你可以借助它选择合适的检查项、映射到测试金字塔,并为 Data Cleaning 与数据管道可靠性设计适合 CI/CD 的数据质量工作流。
作者 phuryn
dummy-dataset 可生成逼真的测试数据,输出为 CSV、JSON、SQL 或 Python 脚本格式。它通过让你定义列、行数和约束条件,帮助制作模拟数据集、演示样例、数据库初始化数据、QA 测试数据以及数据清洗用的示例记录。
作者 duckdb
read-file 帮助代理使用 DuckDB 读取和检查 CSV、JSON、Parquet、Avro、Excel、SQLite、空间文件或远程 URL。可用于预览行、查看 schema、分析数据,并回答“这个文件里有什么”。它更适合读取真实数据制品,不适合源代码。
作者 K-Dense-AI
lamindb 技能可帮助你使用 LaminDB —— 一个开源的生物学数据框架,让数据可查询、可追溯、可复现并符合 FAIR 原则。它适用于 lamindb 的数据分析、元数据整理、基于本体的注释、schema 验证,以及贯穿 notebooks 和 pipelines 的可追踪工作流。
作者 K-Dense-AI
exploratory-data-analysis 技能可将科学文件转换为支持格式感知的 EDA 报告。它会识别文件类型、概括结构与质量、提取关键元数据,并给出后续分析建议。适用于化学、生物信息学、显微镜、光谱学、蛋白质组学、代谢组学等各类科学文件格式的数据分析与探索性数据分析(EDA)。