H
huggingface-datasets
作者 huggingface
使用 huggingface-datasets 技能來處理 Hugging Face Dataset Viewer API 工作流程:驗證資料集、解析 splits、預覽與分頁列資料、搜尋文字、套用篩選條件,並取得 parquet 連結或統計資訊。這是一份實用的 huggingface-datasets 指南,適合只讀的資料集探索。
网页抓取
收藏 0GitHub 10.4k
作者 huggingface
使用 huggingface-datasets 技能來處理 Hugging Face Dataset Viewer API 工作流程:驗證資料集、解析 splits、預覽與分頁列資料、搜尋文字、套用篩選條件,並取得 parquet 連結或統計資訊。這是一份實用的 huggingface-datasets 指南,適合只讀的資料集探索。
作者 duckdb
read-file 可協助代理讀取與檢視 CSV、JSON、Parquet、Avro、Excel、SQLite、空間檔案,或透過 DuckDB 存取遠端 URL。可用來預覽資料列、檢查 schema、分析資料,並回答這個檔案裡有什麼。它最適合用在實際資料檔案上的 read-file 使用情境,不適合原始程式碼。
作者 ClickHouse
chdb-sql 是一個 GitHub 技能,可在 Python 中直接執行 ClickHouse SQL,且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢,以及針對本機檔案與外部資料來源的後端開發工作流程。