Data Cleaning

Kham pha Agent Skill cho Data Cleaning trong Xu ly du lieu va so sanh workflow, cong cu va tinh huong lien quan.

6 skills
S
data-analyst

bởi Shubhamsaboo

data-analyst là một skill GitHub tối giản, định hướng tác nhân sử dụng SQL, pandas và phân tích thống kê cơ bản để khám phá dữ liệu. Phù hợp nhất với người dùng muốn truy vấn, biến đổi và diễn giải có mã nguồn hỗ trợ chỉ từ một lớp prompt SKILL.md duy nhất.

Data Analysis
Yêu thích 0GitHub 104.2k
W
data-quality-frameworks

bởi wshobson

Skill data-quality-frameworks giúp các nhóm lập kế hoạch kiểm định dữ liệu production bằng dbt tests, Great Expectations và data contracts. Hãy dùng skill này để chọn đúng loại kiểm tra, ánh xạ chúng vào testing pyramid và định hướng quy trình data quality sẵn sàng cho CI/CD nhằm phục vụ Data Cleaning và tăng độ tin cậy của pipeline.

Data Cleaning
Yêu thích 0GitHub 32.6k
P
dummy-dataset

bởi phuryn

dummy-dataset tạo dữ liệu kiểm thử chân thực ở dạng CSV, JSON, SQL hoặc script Python. Công cụ này hữu ích cho bộ dữ liệu giả, bản demo, nạp dữ liệu khởi tạo cho cơ sở dữ liệu, QA và làm sạch dữ liệu, vì bạn có thể xác định cột, số lượng dòng và các ràng buộc để tạo ra bản ghi mẫu thuyết phục.

Data Cleaning
Yêu thích 0GitHub 11.1k
D
read-file

bởi duckdb

read-file giúp tác nhân đọc và kiểm tra các file CSV, JSON, Parquet, Avro, Excel, SQLite, file không gian địa lý hoặc URL từ xa bằng DuckDB. Dùng nó để xem trước vài dòng, kiểm tra schema, phân tích dữ liệu và trả lời câu hỏi “trong file này có gì”. Phù hợp nhất cho việc dùng read-file với dữ liệu thực tế, không phải mã nguồn.

Office Documents
Yêu thích 0GitHub 443
K
lamindb

bởi K-Dense-AI

Skill lamindb giúp bạn làm việc với LaminDB, một framework dữ liệu sinh học mã nguồn mở để biến dữ liệu thành dạng có thể truy vấn, truy vết, tái lập và tuân thủ FAIR. Dùng nó cho lamindb trong Phân tích dữ liệu, biên soạn metadata, chú thích dựa trên ontology, kiểm tra schema và các quy trình làm việc có nhận biết lineage trên notebook và pipeline.

Data Analysis
Yêu thích 0GitHub 0
K
exploratory-data-analysis

bởi K-Dense-AI

Kỹ năng exploratory-data-analysis biến các tệp khoa học thành báo cáo EDA có nhận biết định dạng. Kỹ năng này phát hiện loại tệp, tóm tắt cấu trúc và chất lượng, trích xuất siêu dữ liệu quan trọng và gợi ý hướng phân tích tiếp theo. Dùng kỹ năng exploratory-data-analysis cho Data Analysis trong các lĩnh vực hóa học, tin sinh học, hiển vi, quang phổ, proteomics, metabolomics và các định dạng tệp khoa học khác.

Data Analysis
Yêu thích 0GitHub 0
Data Cleaning agent skills