Data Cleaning

데이터 처리 안에서 Data Cleaning 관련 Agent Skill을 살펴보고 비슷한 워크플로와 활용 사례를 비교하세요.

6 개 스킬
S
data-analyst

작성자 Shubhamsaboo

data-analyst는 데이터 탐색을 위해 SQL, pandas, 기본 통계 분석으로 에이전트를 안내하는 미니멀한 GitHub 스킬입니다. 하나의 SKILL.md 프롬프트 레이어에서 코드 기반 질의, 데이터 변환, 해석까지 처리하고 싶은 사용자에게 특히 잘 맞습니다.

Data Analysis
즐겨찾기 0GitHub 104.2k
W
data-quality-frameworks

작성자 wshobson

data-quality-frameworks 스킬은 팀이 dbt tests, Great Expectations, 데이터 계약을 활용해 운영 환경의 데이터 검증을 설계하도록 돕습니다. 어떤 검사를 선택할지 정하고, 이를 테스트 피라미드에 매핑하며, Data Cleaning과 파이프라인 신뢰성을 위한 CI/CD 대응 데이터 품질 워크플로를 구성할 때 유용합니다.

Data Cleaning
즐겨찾기 0GitHub 32.6k
P
dummy-dataset

작성자 phuryn

dummy-dataset은 CSV, JSON, SQL 또는 Python script 형식으로 현실감 있는 테스트 데이터를 생성합니다. 컬럼, 행 수, 제약 조건을 지정해 그럴듯한 샘플 레코드를 만들 수 있어, mock 데이터셋, 데모, database seeding, QA, 데이터 정리에 유용합니다.

Data Cleaning
즐겨찾기 0GitHub 11.1k
D
read-file

작성자 duckdb

read-file는 에이전트가 DuckDB로 CSV, JSON, Parquet, Avro, Excel, SQLite, 공간 파일, 원격 URL을 읽고 검사하도록 돕습니다. 행 미리보기, 스키마 확인, 데이터 프로파일링, 그리고 이 파일에 무엇이 들어 있는지 파악할 때 유용합니다. 소스 코드가 아니라 실제 데이터 산출물에 대한 read-file 사용에 가장 적합합니다.

Office Documents
즐겨찾기 0GitHub 443
K
lamindb

작성자 K-Dense-AI

lamindb 스킬은 오픈소스 생물학 데이터 프레임워크인 LaminDB를 활용해 데이터를 질의 가능하고, 추적 가능하며, 재현 가능하고, FAIR 원칙에 맞게 다루도록 도와줍니다. Data Analysis용 lamindb, 메타데이터 큐레이션, 온톨로지 기반 주석, 스키마 검증, 그리고 노트북과 파이프라인 전반에서 계보 추적을 고려한 워크플로에 사용할 수 있습니다.

Data Analysis
즐겨찾기 0GitHub 0
K
exploratory-data-analysis

작성자 K-Dense-AI

exploratory-data-analysis 스킬은 과학 파일을 형식 인식형 EDA 보고서로 바꿉니다. 파일 유형을 감지하고, 구조와 품질을 요약하며, 핵심 메타데이터를 추출하고, 다음 분석 단계를 제안합니다. 화학, 생정보학, 현미경, 분광학, 프로테오믹스, 메타볼로믹스 등 다양한 과학 파일 형식의 Data Analysis에 필요한 exploratory-data-analysis 용도로 활용하세요.

Data Analysis
즐겨찾기 0GitHub 0
Data Cleaning agent skills