pymc

작성자 K-Dense-AI

PyMC는 Python에서 확률적 모델을 구축, 적합, 점검, 비교하는 데 쓰는 베이지안 모델링 스킬입니다. pymc는 계층적 회귀, 다층 분석, 시계열, 결측값, 측정 오차, 그리고 LOO 또는 WAIC를 활용한 모델 비교에 사용하세요.

Stars0

즐겨찾기0

추가됨2026년 5월 14일

카테고리Data Analysis

설치 명령어

npx skills add K-Dense-AI/claude-scientific-skills --skill pymc

큐레이션 점수

이 스킬의 점수는 84/100으로, 디렉터리 사용자에게 충분히 유력한 등록 후보입니다. 베이지안 모델링 작업에 대해 명확하게 트리거되며, 설치를 정당화할 만큼의 워크플로 상세도도 갖추고 있습니다. 다만 보조 파일과 도입을 돕는 구조가 더해지면 한층 좋아질 것입니다.

84/100

강점

PyMC 5.x+를 포함한 베이지안 모델링에 명확히 범위가 설정되어 있으며, 계층적 모델, NUTS 샘플링, 변분 추론, 모델 비교까지 다룹니다.
운영 지침이 탄탄합니다. 데이터 준비, 샘플링, 검증, 진단, 모델 비교로 이어지는 표준 베이지안 워크플로를 본문에서 분명하게 제시합니다.
에이전트 활용성과 명확성이 좋습니다. 구체적인 사용 사례와 코드 예시가 있어, 일반적인 프롬프트보다 추측의 여지가 적습니다.

주의점

설치 명령이 없고, 보조 스크립트/참고 자료/리소스도 없어 사용자는 `SKILL.md` 내용에만 의존해야 합니다.
저장소가 하나의 긴 스킬 파일에 집중된 형태로 보이므로, 일부 고급 또는 예외적인 도입 경로는 여전히 수동 조정이 필요할 수 있습니다.

Python Pymc Bayesian Modeling Probabilistic Programming Mcmc Variational Inference Statistics Arviz

개요

pymc 스킬 개요

pymc는 Python에서 확률 모델을 구축, 적합, 점검, 비교하기 위한 베이지안 모델링 스킬입니다. 이 스킬은 단순한 점 추정값이 아니라 실제 불확실성 추정이 필요한 경우에 가장 적합합니다. 예를 들어 계층적 회귀, 다층 분석, 시계열, 결측 데이터, 측정 오차, 그리고 LOO나 WAIC를 이용한 모델 비교에 잘 맞습니다.

pymc는 무엇을 위한 스킬인가

pymc 스킬은 복잡한 데이터를 그럴듯한 베이지안 모델로 바꾸고, 일반적인 Python 분석 스크립트가 아니라 posterior inference까지 연결해야 할 때 쓰는 도구입니다. “이 효과를 불확실성과 함께 추정하고 싶다”는 막연한 목표를 실제 PyMC 모델, 샘플링 계획, 검증 워크플로로 구체화하도록 도와줍니다.

누가 사용하면 좋은가

이 pymc 스킬은 결과 변수와 예측 변수는 이미 알고 있지만, 모델을 정확하게 어떻게 표현해야 하는지 도움이 필요한 데이터 분석가, 과학자, ML 실무자에게 잘 맞습니다. 특히 사전분포 선택, 샘플러 문제 디버깅, posterior diagnostics 해석처럼 베이지안 워크플로 판단이 필요한 상황에서 유용합니다.

핵심 차별점

단순한 프롬프트와 비교하면 pymc의 가치는 전체 워크플로를 중심에 둔다는 데 있습니다. 데이터 준비, 모델 명세, 샘플링, 검증, 비교까지 한 흐름으로 다루기 때문에 실무에 더 가깝습니다. 특히 NUTS, prior predictive checks, 수렴 진단에서 자주 막히는 PyMC 프로젝트에서 시행착오를 줄여 주는 점이 실질적인 장점입니다.

pymc 스킬 사용 방법

pymc 스킬 설치하기

스킬 파일에 나온 저장소 명령어나 플랫폼의 스킬 설치 도구를 사용해 pymc 스킬을 skills 디렉터리에 설치하세요. 그다음 scientific-skills/pymc 경로가 실제로 उपलब्ध한지 확인하고, 먼저 SKILL.md를 여는 것이 좋습니다. 이 파일이 의도된 베이지안 워크플로와 적용 범위를 정의하기 때문입니다.

대략적인 목표를 유용한 프롬프트로 바꾸기

“이 데이터셋을 pymc로 분석해줘” 같은 약한 요청은 빠진 정보가 너무 많습니다. 더 강한 프롬프트에는 필요한 모델 유형, 반응 변수, 예상되는 예측 변수, 데이터 크기, 그룹 구조, 분석에서 얻고 싶은 결과가 들어가야 합니다. 예를 들면: “user와 campaign별 전환율에 대한 계층적 로지스틱 회귀를 pymc로 만들고, 약하게 정보적인 priors를 포함한 뒤, 샘플링 진단을 설명하고, pooled model과 비교하는 방법까지 보여줘.”

저장소에서 먼저 읽을 내용

먼저 SKILL.md를 읽고, 그다음 이 스킬을 언제 써야 하는지와 표준 베이지안 워크플로를 설명하는 부분에 집중하세요. 구현 비중이 큰 작업이라면, 모델 코드 작성 전에 데이터 준비, 모델 구축, 샘플링, posterior 확인 예시를 먼저 살펴보는 편이 좋습니다.

결과를 좋게 만드는 워크플로 세부사항

pymc에서는 입력 데이터 형태가 매우 중요합니다. 변수 타입, 그룹 ID, 결측 여부, 그리고 이미 적용한 스케일링이나 범주형 인코딩을 구체적으로 알려주세요. 모델을 초안 수준이 아니라 실제로 쓸 수 있게 만들고 싶다면 priors, sampler 설정, 진단 출력까지 명시하는 것이 좋습니다. Data Analysis용 pymc라면 해석, 예측, 인과 비교, 의사결정 지원 중 무엇이 필요한지도 함께 지정하세요. 각 목적에 따라 모델 구조가 달라집니다.

pymc 스킬 FAQ

pymc는 고급 사용자만 쓰는 스킬인가요?

아닙니다. 데이터 구조를 분명히 설명할 수 있고 모델 진단을 확인할 의향이 있다면 초보자도 pymc 스킬을 사용할 수 있습니다. 보통 더 어려운 부분은 문법이 아니라 모델링 판단이므로, 구조와 검증에 대한 안내가 필요할 때 특히 유용합니다.

언제 pymc를 쓰지 않는 게 좋나요?

간단한 기술 통계 그래프, 기본적인 빈도주의 검정, 또는 불확실성 없이 블랙박스 예측만 필요하다면 pymc를 쓰지 않는 편이 낫습니다. 데이터 생성 과정을 전혀 설명할 수 없는 경우에도 적합하지 않습니다. PyMC는 모델 가정이 명시적일 때 가장 잘 작동하기 때문입니다.

pymc는 일반 프롬프트와 어떻게 다른가요?

일반 프롬프트도 코드를 만들어낼 수는 있지만, pymc는 베이지안 워크플로와 모델 품질에 영향을 주는 대표적인 실패 지점에 초점을 맞춥니다. 그래서 즉흥적인 프롬프트보다 더 나은 priors, 더 나은 샘플링 조언, 더 많은 진단 중심의 답변을 기대할 수 있습니다.

pymc는 더 넓은 Python 생태계와 잘 맞나요?

네. pymc는 Python 분석 스택과 함께 쓰도록 설계되었고, 특히 NumPy, pandas, ArviZ, 그리고 관련 시각화 및 데이터 준비 도구와 잘 맞습니다. 이미 Python으로 분석하는 워크플로를 쓰고 있다면, pymc는 probabilistic modeling을 위한 자연스러운 선택입니다.

pymc 스킬 개선 방법

모델 맥락을 더 구체적으로 제공하기

pymc 결과를 가장 잘 개선하는 방법은 모델 클래스를 처음부터 분명히 말하는 것입니다. linear, logistic, hierarchical, time series, missing-data, measurement-error 중 무엇인지 적어 주세요. 또한 target 변수, predictors, 그룹 수준, 그리고 모델 구조에 영향을 주어야 하는 비즈니스나 과학적 제약도 함께 넣으세요.

코드만이 아니라 진단도 요청하기

pymc에서 생기는 많은 문제는 약한 priors, 부적절한 스케일링, sampler pathology에서 비롯됩니다. prior predictive checks, posterior predictive checks, effective sample size, R-hat, divergences, 그리고 샘플링이 막힐 때 어떻게 바꿀지에 대한 계획까지 요청하세요. 그래야 검증이 중요한 Data Analysis 작업에서 이 스킬이 더 유용해집니다.

데이터 형태와 비교 목표를 함께 주기

첫 결과를 유용하게 만들고 싶다면, 행 수가 얼마인지, 어떤 변수들이 numeric인지 categorical인지, 반복 측정이나 클러스터가 있는지 알려주세요. 모델 비교가 필요하다면 baseline model과 “더 좋다”의 기준도 명시해야 합니다. 그래야 pymc 스킬이 LOO나 WAIC를 적절한 맥락으로 잡아줄 수 있습니다.

첫 적합 결과를 바탕으로 반복하기

첫 시도 뒤에는 새 모델을 처음부터 다시 요청하기보다 실제 trace 문제, posterior plot, divergence 개수 같은 정보를 되돌려 주세요. pymc를 가장 빠르게 개선하는 방법은 가정을 하나씩 다듬는 것입니다. 입력 스케일을 조정하고, priors를 더 타이트하게 또는 느슨하게 조정하고, 계층 구조를 단순화한 뒤 다시 적합하고 비교하세요.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

clickhouse-best-practices

작성자 ClickHouse

clickhouse-best-practices는 Database Engineering을 위한 ClickHouse 모범 사례 skill입니다. 스키마 설계, 쿼리 튜닝, insert 전략, 에이전트 연결성을 규칙 기반 권장사항으로 안내해, ClickHouse 워크플로에서 clickhouse-best-practices 사용을 더 쉽게 트리거하고 검토하며 인용할 수 있게 합니다.

Database Engineering

즐겨찾기 0GitHub 412

chdb-datastore

작성자 ClickHouse

chdb-datastore는 ClickHouse 기반 DataStore API를 활용해 빠른 데이터 분석을 지원하는 pandas 호환 skill입니다. 파일, 데이터베이스, 클라우드 커넥터를 지원하고, 서로 다른 소스 간 조인도 가능하며, pandas 스타일 워크플로우에 최소한의 코드 수정만으로 적용할 수 있습니다. 더 큰 데이터셋을 바로 분석할 수 있는 드롭인 분석 계층이 필요할 때 이 chdb-datastore 가이드를 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

sympy

작성자 K-Dense-AI

sympy 스킬로 Python에서 대수, 미적분, 행렬, 물리 공식, 수론, 기하, 코드 생성까지 정확한 기호 수학을 처리하세요. 식을 정확하게 유지하고, 적절한 SymPy 모듈을 고르며, 부동소수점 위주의 오류를 피하는 데 도움이 됩니다. 기호 워크플로와 데이터 분석용 sympy를 실용적으로 다루려는 사용자에게 특히 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

interpreting-culture-index

작성자 trailofbits

interpreting-culture-index는 Culture Index 설문, 프로필 내보내기 파일, 그리고 관련 채용·코칭 메모를 해석하는 데 도움을 줍니다. 역할 적합도, 팀 역학, 번아웃 위험, 지원자 피드백, 온보딩 계획, 갈등 중재에 이 interpreting-culture-index 스킬을 활용하세요. 화살표 상대 해석, 안티패턴 점검, 그리고 데이터 분석과 의사결정 지원에 유용한 실용적 결과물에 중점을 둡니다.

Data Analysis

즐겨찾기 0GitHub 5k

azure-search-documents-py

작성자 microsoft

azure-search-documents-py는 Python용 Azure AI Search 스킬로, 백엔드 개발에 필요한 설치, 인증, 인덱스 설계, 벡터 검색, 하이브리드 검색, 시맨틱 랭킹, 에이전틱 검색까지 다룹니다. 설정부터 실제 쿼리 패턴까지 실무 중심의 안내가 필요할 때 azure-search-documents-py 스킬을 사용하세요.

Backend Development

즐겨찾기 0GitHub 2.3k

gget

작성자 K-Dense-AI

gget은 CLI 또는 Python에서 20개 이상의 유전체 데이터베이스와 분석 도구에 빠르고 통합적으로 접근할 수 있는 생물정보학 스킬입니다. 유전자 정보, BLAST 관련 조회, AlphaFold 구조, 발현 데이터, 질병 연관성, enrichment 스타일 분석에 활용할 수 있습니다. 빠른 탐색과 gget 기반 데이터 분석 워크플로에 잘 맞습니다.

Data Analysis

즐겨찾기 0GitHub 0

torch-geometric

작성자 K-Dense-AI

PyTorch Geometric 그래프 신경망을 위한 torch-geometric 스킬 가이드입니다. torch-geometric 설치 도움, 사용법, 그래프 분류, 노드 분류, 링크 예측, 이종 그래프, 커스텀 MessagePassing 레이어, 그리고 머신러닝 워크플로에서 GNN 확장까지 다룰 때 활용하세요.

Machine Learning

즐겨찾기 0GitHub 21.4k

rdkit

작성자 K-Dense-AI

RDKit 스킬은 정밀한 화학정보학 워크플로를 지원합니다. SMILES, SDF, MOL, PDB, InChI 파싱부터 descriptor 계산, fingerprint 생성, substructure search, 반응 처리, 2D/3D 좌표 생성까지 다룹니다. 이 RDKit 가이드는 고급 제어, 사용자 정의 sanitization, 그리고 Data Analysis 워크플로에서의 RDKit 활용에 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

huggingface-vision-trainer

작성자 huggingface

huggingface-vision-trainer는 객체 탐지, 이미지 분류, SAM/SAM2 세그멘테이션 같은 비전 학습 작업에 사용할 Hugging Face 스킬을 설치하고 활용하는 데 도움을 줍니다. 데이터셋 준비, 클라우드 GPU 설정, 평가, Trackio 로깅, 결과를 Hub에 푸시하는 과정까지 다루며, 백엔드 자동화와 반복 가능한 학습 워크플로에 적합합니다.

Backend Development

즐겨찾기 0GitHub 10.4k

seo-dataforseo

작성자 AgriciDaniel

seo-dataforseo는 DataForSEO MCP 서버를 통해 Claude를 실시간 SEO 데이터와 연결합니다. SERP 확인, 키워드 리서치, 백링크, 온페이지 분석, 경쟁사 조사, 비즈니스 등록정보, AI 가시성 추적까지 지원합니다. 실제 검색 근거가 필요하고, 명확한 설치 안내와 실용적인 seo-dataforseo 사용법이 중요한 데이터 기반 워크플로에 가장 적합합니다.

Keyword Research

즐겨찾기 0GitHub 6.2k

pymatgen

작성자 K-Dense-AI

pymatgen은 결정 구조, 상평형도, 전자 구조, 파일 변환을 다루는 Python 재료과학 툴킷입니다. 이 pymatgen 스킬은 CIF, POSCAR, VASP, Materials Project 데이터를 활용하는 과학 워크플로를 지원합니다.

Scientific

즐겨찾기 0GitHub 0

geopandas

작성자 K-Dense-AI

Python 지리공간 벡터 데이터 분석을 위한 geopandas 스킬로, shapefiles, GeoJSON, GeoPackage 파일을 다룹니다. 공간 데이터를 읽고, 정리하고, 결합하고, 버퍼를 만들고, 자르고, 재투영하고, 내보내는 작업을 더 적은 추측으로 수행할 때 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0

analyzing-threat-intelligence-feeds

작성자 mukul975

analyzing-threat-intelligence-feeds는 CTI 피드를 수집하고, 지표를 정규화하며, 피드 품질을 평가하고, STIX 2.1 워크플로를 위한 IOC를 보강하는 데 도움을 줍니다. 이 analyzing-threat-intelligence-feeds 스킬은 위협 인텔 운영과 데이터 분석에 맞춰 설계되었으며, TAXII, MISP, 상용 피드를 실무적으로 다루는 방법을 제공합니다.

Data Analysis

즐겨찾기 0GitHub 0

azure-ai-textanalytics-py

작성자 microsoft

azure-ai-textanalytics-py는 Python용 Azure AI Text Analytics 스킬입니다. 감성 분석, 개체 인식, 핵심 구문 추출, 언어 감지, PII 탐지, 의료 NLP에 도움이 됩니다. 앱, 노트북, 데이터 분석 워크플로에서 Azure 클라이언트 설정, 인증, 실전 텍스트 분석을 빠르게 시작해야 할 때 적합합니다.

Data Analysis

즐겨찾기 0GitHub 0

chdb-sql

작성자 ClickHouse

chdb-sql은 서버 없이 Python에서 ClickHouse SQL을 실행할 수 있게 해주는 GitHub 스킬입니다. `chdb.query()`, `Session`, DB-API 연결, `file()`과 `s3()` 같은 테이블 함수, 매개변수화 쿼리, 로컬 파일과 외부 데이터 소스를 다루는 백엔드 개발 워크플로를 폭넓게 다룹니다.

Backend Development

즐겨찾기 0GitHub 0

scvelo

작성자 K-Dense-AI

scvelo는 단일세포 RNA-seq 데이터의 RNA velocity 분석을 위한 Python 기술입니다. 이를 사용해 unspliced 및 spliced mRNA로부터 세포 상태 전이를 추정하고, 궤적 방향을 유추하며, latent time을 계산하고, driver gene을 식별할 수 있습니다. 표준 클러스터링이나 pseudotime만으로는 방향성이 부족할 때, scvelo를 활용한 데이터 분석에 특히 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0