Parquet

Parquet taxonomy generated by the site skill importer.

3 skills
H
huggingface-datasets

bởi huggingface

Dùng skill huggingface-datasets cho các quy trình với Hugging Face Dataset Viewer API để xác thực dataset, xử lý split, xem trước và phân trang các hàng, tìm kiếm văn bản, áp dụng bộ lọc, và lấy liên kết parquet hoặc thống kê. Đây là hướng dẫn thực dụng về huggingface-datasets cho việc khám phá dataset chỉ đọc.

Web Scraping
Yêu thích 0GitHub 10.4k
D
read-file

bởi duckdb

read-file giúp tác nhân đọc và kiểm tra các file CSV, JSON, Parquet, Avro, Excel, SQLite, file không gian địa lý hoặc URL từ xa bằng DuckDB. Dùng nó để xem trước vài dòng, kiểm tra schema, phân tích dữ liệu và trả lời câu hỏi “trong file này có gì”. Phù hợp nhất cho việc dùng read-file với dữ liệu thực tế, không phải mã nguồn.

Office Documents
Yêu thích 0GitHub 443
C
chdb-sql

bởi ClickHouse

chdb-sql là một GitHub skill để chạy ClickHouse SQL trong Python mà không cần server. Skill này bao gồm `chdb.query()`, `Session`, kết nối DB-API, các table function như `file()` và `s3()`, truy vấn tham số, và quy trình phát triển backend với tệp cục bộ cùng nguồn dữ liệu bên ngoài.

Backend Development
Yêu thích 0GitHub 0
Parquet