H
huggingface-datasets
作者 huggingface
在 Hugging Face Dataset Viewer API 工作流中使用 huggingface-datasets 技能,用于校验数据集、解析 splits、预览和分页行、搜索文本、应用过滤器,以及获取 parquet 链接或统计信息。它是一份面向只读数据集探索的实用 huggingface-datasets 指南。
网页抓取
收藏 0GitHub 10.4k
作者 huggingface
在 Hugging Face Dataset Viewer API 工作流中使用 huggingface-datasets 技能,用于校验数据集、解析 splits、预览和分页行、搜索文本、应用过滤器,以及获取 parquet 链接或统计信息。它是一份面向只读数据集探索的实用 huggingface-datasets 指南。
作者 duckdb
read-file 帮助代理使用 DuckDB 读取和检查 CSV、JSON、Parquet、Avro、Excel、SQLite、空间文件或远程 URL。可用于预览行、查看 schema、分析数据,并回答“这个文件里有什么”。它更适合读取真实数据制品,不适合源代码。
作者 ClickHouse
chdb-sql 是一个 GitHub skill,可在 Python 中无需服务端直接运行 ClickHouse SQL。它涵盖 `chdb.query()`、`Session`、DB-API 连接、`file()` 和 `s3()` 等表函数、参数化查询,以及面向本地文件和外部数据源的后端开发工作流。