Data Processing

Data Processing taxonomy generated by the site skill importer.

15 개 스킬
A
regex-vs-llm-structured-text

작성자 affaan-m

구조화된 텍스트 추출에서 regex와 LLM 중 무엇을 선택할지 판단하는 regex-vs-llm-structured-text 스킬입니다. 먼저 결정론적 파싱으로 시작하고, 신뢰도가 낮은 예외에는 LLM 검증을 더한 뒤, 문서·양식·청구서·데이터 분석에 더 저렴하고 신뢰도 높은 파이프라인을 사용하세요.

Data Analysis
즐겨찾기 0GitHub 156.2k
K
omero-integration

작성자 K-Dense-AI

백엔드 개발에서 OMERO Python 워크플로우를 다루는 omero-integration 스킬입니다. OMERO에 연결해 프로젝트, 데이터셋, 이미지, ROI, 주석, 테이블을 가져오고, 배치 스크립트도 더 적은 추측으로 실행할 수 있습니다.

Backend Development
즐겨찾기 0GitHub 21.3k
K
hypogenic

작성자 K-Dense-AI

hypogenic은 LLM 지원을 바탕으로 표나 텍스트에서 파생된 데이터셋에 대해 가설을 생성하고 검증하는 skill입니다. 분류 해석, 콘텐츠 분석, 허위 탐지처럼 경험적 질문을 구조화된 검증 가능 워크플로로 바꿔 데이터 분석에서의 hypogenic을 돕습니다. 단순한 브레인스토밍이 아니라 증거에 기반한 가설이 필요할 때 사용하세요.

Data Analysis
즐겨찾기 0GitHub 21.3k
K
dnanexus-integration

작성자 K-Dense-AI

dnanexus-integration은 DNAnexus 클라우드 유전체학 작업에 유용한 실전형 스킬입니다. 앱과 applet을 만들고, 업로드와 다운로드를 관리하며, dxpy로 워크플로를 실행하고 파이프라인을 자동화하는 데 사용할 수 있습니다. dnanexus-integration 가이드는 FASTQ, BAM, VCF 파일은 물론 플랫폼별 설정과 작업 실행이 포함된 Backend Development 업무에 도움이 됩니다.

Backend Development
즐겨찾기 0GitHub 21.3k
H
huggingface-datasets

작성자 huggingface

Hugging Face Dataset Viewer API 작업에 이 huggingface-datasets 스킬을 사용해 데이터셋을 검증하고, split을 확인하며, 행을 미리 보고 페이지네이션하고, 텍스트를 검색하고, 필터를 적용하고, parquet 링크나 통계를 가져올 수 있습니다. 읽기 전용 데이터셋 탐색을 위한 실용적인 huggingface-datasets 가이드입니다.

Web Scraping
즐겨찾기 0GitHub 10.4k
V
Workspace Data Analyst

작성자 VoltAgent

Workspace Data Analyst는 워크스페이스에서 데이터를 빠르게 분석할 수 있는 가벼운 스킬입니다. CSV 파일을 분석하고, 헤더를 확인하며, 합계·평균·이상치를 요약한 뒤, 다음 단계에 바로 쓸 수 있는 간결한 인사이트를 제공합니다. Workspace Data Analyst 스킬은 더 깊은 모델링 전에 파일을 빠르게 점검하는 용도에 적합합니다.

Data Analysis
즐겨찾기 0GitHub 8.5k
M
azure-storage-file-datalake-py

작성자 microsoft

azure-storage-file-datalake-py는 Azure Data Lake Storage Gen2를 위한 Python 스킬입니다. 백엔드 개발자와 에이전트가 계층형 파일 시스템 작업에 필요한 Azure SDK를 설치하고, 인증하고, 사용하는 데 도움을 줍니다. 예를 들어 목록 조회, 업로드, 다운로드, 디렉터리와 파일 관리 같은 작업을 다룹니다.

Backend Development
즐겨찾기 0GitHub 2.3k
M
azure-cosmos-py

작성자 microsoft

azure-cosmos-py 스킬은 Azure Cosmos DB Python SDK를 설치, 설정, 활용하는 데 도움을 줍니다. NoSQL CRUD, 쿼리, 컨테이너 설정, 파티셔닝, 인증까지 다루며, 특히 파티션 키와 쿼리 비용이 중요한 Database Engineering 작업에 유용합니다.

Database Engineering
즐겨찾기 0GitHub 2.2k
C
clickhouse-best-practices

작성자 ClickHouse

clickhouse-best-practices는 Database Engineering을 위한 ClickHouse 모범 사례 skill입니다. 스키마 설계, 쿼리 튜닝, insert 전략, 에이전트 연결성을 규칙 기반 권장사항으로 안내해, ClickHouse 워크플로에서 clickhouse-best-practices 사용을 더 쉽게 트리거하고 검토하며 인용할 수 있게 합니다.

Database Engineering
즐겨찾기 0GitHub 412
T
tinybird

작성자 tinybirdco

Tinybird 프로젝트 파일, SQL 규칙, 최적화 패턴, 파일 기반 워크플로를 위한 베스트 프랙티스입니다. 데이터소스, 파이프, 엔드포인트, materialized views, 그리고 저장소 규칙에 기반한 배포 안전 가이드가 필요할 때 Backend Development용으로 이 tinybird skill을 사용하세요.

Backend Development
즐겨찾기 0GitHub 16
K
pymatgen

작성자 K-Dense-AI

pymatgen은 결정 구조, 상평형도, 전자 구조, 파일 변환을 다루는 Python 재료과학 툴킷입니다. 이 pymatgen 스킬은 CIF, POSCAR, VASP, Materials Project 데이터를 활용하는 과학 워크플로를 지원합니다.

Scientific
즐겨찾기 0GitHub 0
K
exploratory-data-analysis

작성자 K-Dense-AI

exploratory-data-analysis 스킬은 과학 파일을 형식 인식형 EDA 보고서로 바꿉니다. 파일 유형을 감지하고, 구조와 품질을 요약하며, 핵심 메타데이터를 추출하고, 다음 분석 단계를 제안합니다. 화학, 생정보학, 현미경, 분광학, 프로테오믹스, 메타볼로믹스 등 다양한 과학 파일 형식의 Data Analysis에 필요한 exploratory-data-analysis 용도로 활용하세요.

Data Analysis
즐겨찾기 0GitHub 0
K
astropy

작성자 K-Dense-AI

astropy는 천문학 및 천체물리학 워크플로를 위한 Python 툴킷입니다. 이 astropy 스킬은 천체 좌표, 단위, FITS 파일, 시간 척도, 테이블, WCS, 우주론, 그리고 데이터 분석용 astropy에 유용합니다. 좌표 변환, 단위 변환, 데이터 처리 같은 실무 천문학 작업을 돕습니다.

Data Analysis
즐겨찾기 0GitHub 0
K
aeon

작성자 K-Dense-AI

aeon은 시계열 머신러닝을 위한 scikit-learn 호환 Python 스킬입니다. 분류, 회귀, 군집화, 예측, 이상 탐지, 세분화, 유사도 검색 등 다양한 시계열 데이터 워크플로에 활용할 수 있습니다. 일반적인 표 형식 ML로는 부족하고, 단변량·다변량 분석에 특화된 방법이 필요할 때 적합합니다.

Data Analysis
즐겨찾기 0GitHub 0
S
postgres

작성자 sanjay3290

postgres 스킬은 읽기 전용 SQL로 실시간 PostgreSQL 데이터베이스를 점검할 수 있게 해줍니다. 스키마 파악, 테이블 확인, 여러 연결에 걸친 SELECT 기반 분석에 유용하며, 설명을 바탕으로 자동 선택도 지원합니다. Database Engineering 워크플로우에 맞게 설계되었고, 안전을 위해 INSERT, UPDATE, DELETE, DROP 같은 쓰기 작업은 차단합니다.

Database Engineering
즐겨찾기 0GitHub 0
Data Processing