query

作者 duckdb

query 技能可对已挂载的数据库运行 DuckDB 查询，也可直接针对文件查询。它支持 SQL 和自然语言提问，兼容 session 与 ad-hoc 两种模式，适用于数据分析、快速检查，以及借助 DuckDB Friendly SQL 进行迭代式查询工作。

Stars443

收录时间2026年5月9日

分类数据分析

安装命令

npx skills add duckdb/duckdb-skills --skill query

编辑评分

该技能评分为 71/100，说明它适合想要一个具有实际操作价值的 DuckDB 查询助手的目录用户，但也应预期一定的上手阻力和不够完整的引导说明。仓库展示了在 session 查询与 ad-hoc 查询之间进行路由的具体工作流，因此并非空壳；不过，除逐步执行逻辑外，文件提供的高层说明较少，使得安装决策不算特别直观。

71/100

亮点

触发条件和适用范围明确：它显然用于对已挂载的 DuckDB 数据库运行 SQL 查询，或针对文件进行 ad-hoc 查询，也支持自然语言提问。
操作流程具体：技能定义了状态检测、session 与 ad-hoc 模式、DuckDB 可用性检查以及回退行为。
实现细节比较充实：`SKILL.md` 正文较长，包含代码块和仓库/文件引用，而不只是泛泛的说明。

注意点

顶层描述较少，且没有配套文件，安装前更难快速判断是否适合。
未提供安装命令或配套资源，用户可能需要仅根据正文自行推断安装方式和边界情况。

Duckdb Sql 查询优化 File Automation CSV TSV JSON Duckdb Skills

概览

query 技能概览

query 技能能做什么

query 技能可以帮助你对已挂载的工作数据库，或你直接指定的文件运行 DuckDB 查询。它面向的是想尽快把问题变成结果的人：临时 SQL、自然语言数据提问，或者用 DuckDB Friendly SQL 做简单的基于文件分析。

最适合谁使用

如果你的数据已经在 DuckDB、项目状态文件里，或者在 CSV/Parquet 之类的本地文件中，并且你想不搭完整流水线就立刻拿到答案，那么 query 技能就很适合做 Data Analysis。它尤其适合需要快速、反复查看数据的分析师、工程师和 AI agent。

这个技能的不同之处

query 的核心差异在于模式选择。只要存在之前的 DuckDB 状态，它就可以在 session mode 下工作；如果输入引用了文件，或者当前没有可用状态，它就会切到 ad-hoc mode。这样能减少猜测，让 query skill 同时适用于持久化工作流和一次性工作流。

如何使用 query 技能

安装与基础调用

使用 npx skills add duckdb/duckdb-skills --skill query 安装 query 技能。然后你可以直接传 SQL 或问题，例如：query "show daily revenue by country" 或 query "select count(*) from 'events.csv'"。query usage 这种用法在请求足够具体、能自然收敛成一条明确查询时效果最好。

query 技能如何选择 session 或 ad-hoc 模式

query 技能会先检查 .duckdb-skills/state.sql 或 ~/.duckdb-skills/<project-id>/state.sql 中是否存在已有的 DuckDB state file。如果找到了，而且已挂载的数据库仍然可用，它就会使用 session mode。若你传了 --file、在提示词里引用了文件路径，或者没有可用状态，它就会切换到 ad-hoc mode，直接查询文件；必要时则使用 :memory:。这是 query guide 里最关键的一点，因为你的输入应该和你真正想要的模式一致。

先读仓库里的哪些内容

先看 SKILL.md，因为这里写明了执行流程、模式规则和 fallback 行为。对于安装决策来说，通常看这一份就够了。如果你要把这个技能改造成自己的工作流，也可以继续查看仓库树里被引用的其他文件，尤其是定义 state 处理或 prompt 约束的内容。这个仓库里没有额外的 rules/、resources/ 或辅助脚本需要额外学习。

如何写出更好的提示来得到更好的查询

给技能最少但足够的上下文，让它生成正确的查询：目标文件或表、指标、粒度、过滤条件和时间范围。好的输入像 query "For orders.csv, show revenue by month for 2024 and exclude refunds"；差的输入像 query "analyze the sales data"。前者能明确告诉技能该用基于文件的访问方式、该怎么汇总，以及哪些边界情况需要处理。

query 技能常见问题

query 技能只适合 SQL 专家吗？

不适合。query 技能既接受原始 SQL，也接受自然语言问题，所以初学者也能用它做比较直接的分析。不过，当你需要精确的 join、过滤或聚合规则时，SQL 仍然更有帮助。

什么时候不该用 query 技能？

如果你的任务需要多步转换逻辑，而这些逻辑更适合放在 notebook、ETL job 或应用代码里，就不要用它。它优化的是提出和回答数据问题，而不是构建完整的数据产品。

它和普通 prompt 相比有什么不同？

普通 prompt 也许能生成一条看起来合理的查询，但 query 技能额外加入了运行层规则：它会检查 DuckDB state、选择 session vs ad-hoc mode、验证 DuckDB 是否可用，并在挂载失败时安全回退。这让它在安装时评估和重复 query usage 时都更可靠。

它适合文件和本地分析吗？

适合。如果你想对本地 CSV、Parquet 或其他 DuckDB 可读文件做 query for Data Analysis，这个技能非常合适，因为它在没有 session state，或者 session state 不合适时，本来就是为直接查询文件而设计的。

如何改进 query 技能

提供准确的数据形状

最有效的改进来自把数据源和输出形状说清楚。把表名、文件名、你关心的列，以及希望返回的粒度都写出来。例如：query "from sessions.parquet, group by user_id and return avg session length for paid users only" 就能给技能足够的结构，避免结果过宽或含糊。

在第一次运行前先消除歧义

常见失败模式是只说想要“insights”，却没有说明应该统计什么、比较什么或过滤什么。如果你知道指标、日期窗口或分群规则，最好一开始就写进去。这样可以减少来回追问，也能让第一次答案更有用。

尽早检查与模式相关的限制

如果你预期会走 session mode，先确认项目 state 已存在，而且已挂载的数据库还能正常打开。如果你预期会走 file mode，就在提示词里直接引用文件，或者传 --file。这一点很重要，因为 query 技能会根据能否复用现有状态，或必须临时处理，表现出不同的行为。

通过逐步收紧目标来迭代

拿到第一版结果后，下一轮提示词每次只加一个约束：更窄的时间范围、更好的 join key、不同的分组层级，或者必须排除的条件。这样可以让 query skill 继续朝着可决策的结果推进，而不是停留在模糊总结。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是面向数据库工程的 ClickHouse 最佳实践技能。它围绕 schema 设计、查询调优、写入策略和 agent 连接提供基于规则的建议，让 clickhouse-best-practices 在 ClickHouse 工作流中的触发、审阅和引用都更容易。

数据库工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一个兼容 pandas 的技能，借助 ClickHouse-backed DataStore API 提供快速数据分析。它支持文件、数据库和云端连接器，支持跨数据源联表，并且只需对 pandas 风格工作流做少量代码改动。若你希望为更大规模数据集提供一个可直接替换的分析层，这份 chdb-datastore 指南会很合适。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中进行精确的符号数学运算，涵盖代数、微积分、矩阵、物理公式、数论、几何和代码生成。它能帮助你保持表达式精确，选择合适的 SymPy 模块，并避免大量浮点数带来的错误。适合需要一份实用 sympy 指南来处理符号工作流，以及用于 Data Analysis 的 sympy 的用户。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可帮助解读 Culture Index 调查、个人档案导出内容以及相关的招聘或辅导记录。这个 interpreting-culture-index 技能适用于岗位匹配、团队动力、倦怠风险、候选人复盘、入职规划和冲突调解。它强调基于箭头相对关系的阅读、反模式检查，以及面向数据分析和决策支持的实用输出。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是面向后端开发的 Python 版 Azure AI Search 技能，覆盖安装、身份验证、索引设计、向量搜索、混合搜索、语义排序和 agentic retrieval。当前你需要从环境搭建一路做到可用查询模式时，可以使用 azure-search-documents-py 技能获取实操指引。

后端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一款生物信息学技能，可通过 CLI 或 Python 快速、统一地访问 20+ 个基因组数据库和分析工具。适合查询基因信息、BLAST 相关检索、AlphaFold 结构、表达数据、疾病关联以及富集分析等场景，也很适合用于快速探索和 gget 数据分析工作流。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

面向 PyTorch Geometric 图神经网络的 torch-geometric 技能指南。适用于 torch-geometric 安装帮助、torch-geometric 使用、图分类、节点分类、链接预测、异构图、自定义 MessagePassing 层，以及面向 Machine Learning 工作流的 GNN 扩展与性能优化。

机器学习

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能适用于需要精细控制的化学信息学工作流：解析 SMILES、SDF、MOL、PDB 和 InChI；计算描述符；生成指纹；执行子结构检索；处理反应；以及构建 2D/3D 坐标。将这份 rdkit 指南用于高级控制、自定义 sanitize，以及面向数据分析的 rdkit 工作流。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 帮你安装并使用一个用于视觉训练任务的 Hugging Face 技能：目标检测、图像分类以及 SAM/SAM2 分割。内容涵盖数据集准备、云端 GPU 配置、评估、Trackio 日志记录和结果推送到 Hub。适合后端自动化和可重复的训练工作流。

后端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 通过 DataForSEO MCP server 将 Claude 连接到实时 SEO 数据，可用于 SERP 检查、关键词研究、反向链接、页面分析、竞品研究、商家信息和 AI 可见性追踪。它最适合需要真实搜索证据、清晰安装指引以及实用 seo-dataforseo 用法的数据驱动工作流。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一项用于在 Python 中构建、拟合、检查和比较概率模型的贝叶斯建模技能。可将 pymc 用于分层回归、多层分析、时间序列、缺失数据、测量误差，以及使用 LOO 或 WAIC 进行模型比较。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一个面向 Python 的材料科学工具包，支持晶体结构、相图、电子结构和文件转换。这个 pymatgen 技能可帮助处理涉及 CIF、POSCAR、VASP 和 Materials Project 数据的科研工作流。

科学

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

面向 Python 地理空间矢量数据分析的 geopandas 技能，涵盖 shapefile、GeoJSON 和 GeoPackage 文件。可用于读取、清洗、连接、缓冲区分析、裁剪、重投影和导出空间数据，减少试错成本。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

analyzing-threat-intelligence-feeds 可帮助你摄取 CTI 情报源、规范化指标、评估情报源质量，并为 STIX 2.1 工作流丰富 IOC。这个 analyzing-threat-intelligence-feeds 技能面向威胁情报运营和数据分析，提供 TAXII、MISP 及商业情报源的实用指导。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是面向 Python 的 Azure AI Text Analytics 技能。它可帮助你完成情感分析、实体识别、关键词提取、语言检测、PII 检测和医疗 NLP。适合需要快速完成 Azure 客户端配置、身份验证，以及在应用、notebook 或数据分析流程中落地文本分析的场景。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一个 GitHub skill，可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询，以及面向本地文件和外部数据源的后端开发工作流。

后端开发

收藏 0GitHub 0