pydeseq2

작성자 K-Dense-AI

pydeseq2는 bulk RNA-seq 차등 발현 분석을 위한 Python DESeq2 스킬입니다. 조건 비교, 단일/다중 요인 설계 적합, Wald 검정과 FDR 보정 적용, pandas 및 AnnData 워크플로우에서 volcano/MA plot 생성에 활용할 수 있습니다.

Stars0

즐겨찾기0

추가됨2026년 5월 14일

카테고리Data Analysis

설치 명령어

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

큐레이션 점수

이 스킬은 100점 만점에 80점으로, 목록에 포함할 가치가 있습니다. 이 저장소는 디렉터리 사용자가 에이전트가 언제 이 스킬을 써야 하는지 파악하고, 실제 PyDESeq2 차등 발현 워크플로우를 따라가며, 일반적인 프롬프트보다 적은 추측으로 적용할 수 있다는 근거를 충분히 제공합니다. 완벽하게 패키징된 형태는 아니지만, bulk RNA-seq 분석 사용자에게는 상당한 실행 정보와 명확한 설치 가치가 있습니다.

80/100

강점

트리거 명확성: frontmatter와 "When to Use This Skill"에서 DESeq2, 차등 발현, bulk RNA-seq count, PyDESeq2를 직접 겨냥합니다.
실행 중심 워크플로우: 스킬 본문에 pandas, DeseqDataSet, DeseqStats, 필터링, Wald 검정, FDR 보정을 포함한 구체적인 빠른 시작 예제가 있습니다.
에이전트 활용도 높음: 단일 요인/다중 요인 설계, batch/covariate 처리, apeGLM shrinkage, pandas/AnnData 통합까지 다룹니다.

주의점

설치 명령이나 지원 파일이 제공되지 않아, 사용자가 환경/설정 세부 사항을 스스로 유추해야 할 수 있습니다.
저장소에는 experimental/test 신호가 표시되어 있으며, 참고자료나 보조 자산 없이 단일 SKILL.md만 있는 형태로 보입니다.

Python Pandas Bioinformatics Genomics Dataset

개요

pydeseq2 스킬 개요

pydeseq2가 필요한 경우

pydeseq2는 bulk RNA-seq 카운트 데이터를 대상으로 차등 발현 분석을 수행하는 Python 스킬입니다. 원시 카운트와 샘플 메타데이터를 받아 DE 결과, fold change, 보정된 p-value, 그리고 volcano plot과 MA plot 같은 기본 탐색용 출력까지 이어지도록 도와줍니다.

이런 사용자에게 적합합니다

Python에서 DESeq2 스타일 분석을 하고 싶거나, 다중 요인 설계를 다뤄야 하거나, 차등 발현 분석을 pandas/AnnData 기반 워크플로에 자연스럽게 넣고 싶다면 pydeseq2 스킬이 잘 맞습니다. 이미 카운트 매트릭스와 임상 또는 실험 메타데이터를 갖고 있는 분석가에게는 적합하지만, RNA-seq 전처리 전체 파이프라인을 찾는 사용자에게는 맞지 않습니다.

유용한 이유

pydeseq2의 핵심 가치는 Python 사용자가 차등 발현을 위해 R의 DESeq2로 따로 넘어가야 하는 번역 부담을 줄여준다는 점입니다. Wald 검정, 다중검정 보정, 선택적 apeGLM shrinkage, 그리고 노트북이나 파이프라인에서 재현 가능하게 쓰기 좋은 워크플로를 지원합니다.

pydeseq2 스킬 사용하는 방법

pydeseq2 설치하기

Claude skill set에 이 스킬을 추가한 뒤, 프롬프트를 넣기 전에 스킬 파일을 먼저 여세요:
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

pydeseq2 설치와 설정을 결정할 때는, 환경에 RNA-seq 카운트 테이블과 샘플 메타데이터, 그리고 워크플로에 필요한 Python 패키지가 이미 있는지 확인하세요. 샘플별 유전자 카운트와 설계식 또는 그룹 변수를 제공할 수 있을 때 가장 유용합니다.

올바른 입력부터 시작하기

pydeseq2를 잘 쓰려면 입력 구조가 깔끔해야 합니다:

샘플을 행, 유전자를 열로 둔 카운트 매트릭스
샘플 ID로 인덱싱된 메타데이터
명확한 조건 컬럼과, 모델에 넣을 배치 또는 공변량 컬럼
treated vs control 같은 명시적인 비교 대상

약한 프롬프트는 이런 식입니다: “내 RNA-seq 데이터로 차등 발현 분석해줘.”
더 강한 프롬프트는 이렇게 씁니다: “24개 샘플의 bulk RNA-seq 카운트 매트릭스에 pydeseq2를 사용해서 treated vs control을 비교하고, batch를 공변량으로 포함하고, 매우 낮은 카운트 유전자는 필터링한 뒤, 유의한 유전자와 volcano/MA plot 코드를 반환해줘.”

먼저 읽어야 할 파일

워크플로와 예상되는 분석 단계를 보려면 SKILL.md부터 시작하세요. 그다음 README.md, AGENTS.md, metadata.json, 그리고 존재한다면 rules/, resources/, references/, scripts/ 폴더도 확인하세요. 이 저장소에서는 실무적으로 가장 중요한 신호가 SKILL.md에 있으므로, 추가 보조 파일이 반드시 있다고 가정하지 마세요.

pydeseq2를 제대로 활용하기

pydeseq2를 단순한 코드 생성기가 아니라 분석 방법으로 다루세요. 모델에게 다음을 분명히 알려 주세요:

어떤 생물종과 assay를 다루는지
샘플이 어떻게 그룹화되어 있는지
단일 요인 설계가 필요한지, 다중 요인 설계가 필요한지
shrinkage, 랭킹, 시각화가 필요한지
dataframe, notebook 셀, 재사용 가능한 스크립트 등 어떤 출력 형식이 필요한지

이렇게 해야 모델이 추측으로 처리하지 않고, 적절한 설계·필터링·해석 단계를 선택할 수 있어 pydeseq2 활용도가 높아집니다.

pydeseq2 스킬 FAQ

pydeseq2는 DESeq2 사용자만 위한 도구인가요?

아닙니다. Python에서 DESeq2 유사 차등 발현 분석을 하고 싶은 사람이라면 누구나 사용할 수 있습니다. 이미 pandas, scanpy, AnnData 환경에서 작업하고 있고 분석을 한 스택 안에 유지하고 싶을 때 특히 유용합니다.

사용하려면 완벽한 프롬프트가 필요한가요?

아닙니다. 다만 너무 모호한 프롬프트는 일반적인 분석 코드만 만들어내기 쉽습니다. pydeseq2 스킬은 카운트 테이블의 형태, 관심 있는 비교, 그리고 이미 알고 있는 교란 요인을 함께 제공할 때 가장 잘 작동합니다.

pydeseq2는 초보자 친화적인가요?

RNA-seq 카운트와 실험 설계의 기본을 이미 이해하고 있다면 초보자도 쓰기 쉽습니다. 하지만 정렬, 정량화, 또는 차등 발현 전에 필요한 상류 QC까지 도움을 받아야 한다면 적합하지 않습니다.

언제 pydeseq2를 쓰지 말아야 하나요?

단일세포 차등 발현, 원시 카운트가 없는 정규화 발현값 분석, 또는 전체 전사체 분석을 처음부터 끝까지 처리해야 하는 워크플로에는 쓰지 마세요. 유전자 수준 카운트 데이터가 없고 통계적 해석만 필요한 경우에도 올바른 선택이 아닙니다.

pydeseq2 스킬 개선하기

생물학적 맥락을 더 잘 전달하기

pydeseq2 결과는 파일 이름만 나열하는 프롬프트보다, 연구 설계를 설명하는 프롬프트에서 훨씬 좋아집니다. 반응 변수, 대조 조건, 배치 효과, 반복 수, 그리고 유전자 랭킹, plot 코드, 해석 중 무엇이 필요한지 함께 적어 주세요.

중요한 분석 결정을 명시하기

낮은 카운트 유전자를 어떻게 처리할지, 다중 요인 모델이 필요한지, 효과 크기에 shrinkage를 적용할지 스킬에 알려 주세요. 이런 선택은 pydeseq2 출력에 실질적인 영향을 주며, 연구와 맞지 않을 수 있는 일반적인 기본값을 피하는 데 도움이 됩니다.

재사용 가능한 출력을 요청하기

단순히 “결과”만 요청하지 말고, 저장 가능한 dataframe 스키마, plotting snippet, 또는 notebook에 바로 넣을 수 있는 워크플로를 요청하세요. 예를 들어: “모델을 적합하고, adjusted p-values를 추출한 뒤, log2 fold change와 padj가 포함된 유의 유전자 CSV를 쓰는 pydeseq2 코드를 반환해줘.”

최종 결과만 보지 말고 진단부터 반복하기

첫 실행 결과가 이상하다면, 샘플 클러스터링, 카운트 필터링 근거, 유지된 유전자 수, 설계식의 혼란(confounding) 여부처럼 QC 관점의 점검을 요청하세요. 결과가 약하거나 예상보다 지나치게 적을 때 pydeseq2 for Data Analysis를 개선하는 가장 빠른 방법입니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

clickhouse-best-practices

작성자 ClickHouse

clickhouse-best-practices는 Database Engineering을 위한 ClickHouse 모범 사례 skill입니다. 스키마 설계, 쿼리 튜닝, insert 전략, 에이전트 연결성을 규칙 기반 권장사항으로 안내해, ClickHouse 워크플로에서 clickhouse-best-practices 사용을 더 쉽게 트리거하고 검토하며 인용할 수 있게 합니다.

Database Engineering

즐겨찾기 0GitHub 412

chdb-datastore

작성자 ClickHouse

chdb-datastore는 ClickHouse 기반 DataStore API를 활용해 빠른 데이터 분석을 지원하는 pandas 호환 skill입니다. 파일, 데이터베이스, 클라우드 커넥터를 지원하고, 서로 다른 소스 간 조인도 가능하며, pandas 스타일 워크플로우에 최소한의 코드 수정만으로 적용할 수 있습니다. 더 큰 데이터셋을 바로 분석할 수 있는 드롭인 분석 계층이 필요할 때 이 chdb-datastore 가이드를 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

sympy

작성자 K-Dense-AI

sympy 스킬로 Python에서 대수, 미적분, 행렬, 물리 공식, 수론, 기하, 코드 생성까지 정확한 기호 수학을 처리하세요. 식을 정확하게 유지하고, 적절한 SymPy 모듈을 고르며, 부동소수점 위주의 오류를 피하는 데 도움이 됩니다. 기호 워크플로와 데이터 분석용 sympy를 실용적으로 다루려는 사용자에게 특히 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

interpreting-culture-index

작성자 trailofbits

interpreting-culture-index는 Culture Index 설문, 프로필 내보내기 파일, 그리고 관련 채용·코칭 메모를 해석하는 데 도움을 줍니다. 역할 적합도, 팀 역학, 번아웃 위험, 지원자 피드백, 온보딩 계획, 갈등 중재에 이 interpreting-culture-index 스킬을 활용하세요. 화살표 상대 해석, 안티패턴 점검, 그리고 데이터 분석과 의사결정 지원에 유용한 실용적 결과물에 중점을 둡니다.

Data Analysis

즐겨찾기 0GitHub 5k

azure-search-documents-py

작성자 microsoft

azure-search-documents-py는 Python용 Azure AI Search 스킬로, 백엔드 개발에 필요한 설치, 인증, 인덱스 설계, 벡터 검색, 하이브리드 검색, 시맨틱 랭킹, 에이전틱 검색까지 다룹니다. 설정부터 실제 쿼리 패턴까지 실무 중심의 안내가 필요할 때 azure-search-documents-py 스킬을 사용하세요.

Backend Development

즐겨찾기 0GitHub 2.3k

gget

작성자 K-Dense-AI

gget은 CLI 또는 Python에서 20개 이상의 유전체 데이터베이스와 분석 도구에 빠르고 통합적으로 접근할 수 있는 생물정보학 스킬입니다. 유전자 정보, BLAST 관련 조회, AlphaFold 구조, 발현 데이터, 질병 연관성, enrichment 스타일 분석에 활용할 수 있습니다. 빠른 탐색과 gget 기반 데이터 분석 워크플로에 잘 맞습니다.

Data Analysis

즐겨찾기 0GitHub 0

channel-economics

작성자 alirezarezvani

channel-economics는 RevOps 및 영업 조직 리더가 직접 판매, 파트너, marketplace, reseller, OEM 채널을 fully loaded cost-to-serve, ROI 관점, 제약 조건을 반영한 channel-mix 추천으로 비교할 수 있게 돕습니다. Python scripts, data templates, channel-economics 사용 가이드가 포함되어 있습니다.

Revenue Operations

즐겨찾기 0GitHub 22.1k

torch-geometric

작성자 K-Dense-AI

PyTorch Geometric 그래프 신경망을 위한 torch-geometric 스킬 가이드입니다. torch-geometric 설치 도움, 사용법, 그래프 분류, 노드 분류, 링크 예측, 이종 그래프, 커스텀 MessagePassing 레이어, 그리고 머신러닝 워크플로에서 GNN 확장까지 다룰 때 활용하세요.

Machine Learning

즐겨찾기 0GitHub 21.4k

rdkit

작성자 K-Dense-AI

RDKit 스킬은 정밀한 화학정보학 워크플로를 지원합니다. SMILES, SDF, MOL, PDB, InChI 파싱부터 descriptor 계산, fingerprint 생성, substructure search, 반응 처리, 2D/3D 좌표 생성까지 다룹니다. 이 RDKit 가이드는 고급 제어, 사용자 정의 sanitization, 그리고 Data Analysis 워크플로에서의 RDKit 활용에 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

huggingface-vision-trainer

작성자 huggingface

huggingface-vision-trainer는 객체 탐지, 이미지 분류, SAM/SAM2 세그멘테이션 같은 비전 학습 작업에 사용할 Hugging Face 스킬을 설치하고 활용하는 데 도움을 줍니다. 데이터셋 준비, 클라우드 GPU 설정, 평가, Trackio 로깅, 결과를 Hub에 푸시하는 과정까지 다루며, 백엔드 자동화와 반복 가능한 학습 워크플로에 적합합니다.

Backend Development

즐겨찾기 0GitHub 10.4k

seo-dataforseo

작성자 AgriciDaniel

seo-dataforseo는 DataForSEO MCP 서버를 통해 Claude를 실시간 SEO 데이터와 연결합니다. SERP 확인, 키워드 리서치, 백링크, 온페이지 분석, 경쟁사 조사, 비즈니스 등록정보, AI 가시성 추적까지 지원합니다. 실제 검색 근거가 필요하고, 명확한 설치 안내와 실용적인 seo-dataforseo 사용법이 중요한 데이터 기반 워크플로에 가장 적합합니다.

Keyword Research

즐겨찾기 0GitHub 6.2k

pymc

작성자 K-Dense-AI

PyMC는 Python에서 확률적 모델을 구축, 적합, 점검, 비교하는 데 쓰는 베이지안 모델링 스킬입니다. pymc는 계층적 회귀, 다층 분석, 시계열, 결측값, 측정 오차, 그리고 LOO 또는 WAIC를 활용한 모델 비교에 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

pymatgen

작성자 K-Dense-AI

pymatgen은 결정 구조, 상평형도, 전자 구조, 파일 변환을 다루는 Python 재료과학 툴킷입니다. 이 pymatgen 스킬은 CIF, POSCAR, VASP, Materials Project 데이터를 활용하는 과학 워크플로를 지원합니다.

Scientific

즐겨찾기 0GitHub 0

geopandas

작성자 K-Dense-AI

Python 지리공간 벡터 데이터 분석을 위한 geopandas 스킬로, shapefiles, GeoJSON, GeoPackage 파일을 다룹니다. 공간 데이터를 읽고, 정리하고, 결합하고, 버퍼를 만들고, 자르고, 재투영하고, 내보내는 작업을 더 적은 추측으로 수행할 때 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0

analyzing-threat-intelligence-feeds

작성자 mukul975

analyzing-threat-intelligence-feeds는 CTI 피드를 수집하고, 지표를 정규화하며, 피드 품질을 평가하고, STIX 2.1 워크플로를 위한 IOC를 보강하는 데 도움을 줍니다. 이 analyzing-threat-intelligence-feeds 스킬은 위협 인텔 운영과 데이터 분석에 맞춰 설계되었으며, TAXII, MISP, 상용 피드를 실무적으로 다루는 방법을 제공합니다.

Data Analysis

즐겨찾기 0GitHub 0

azure-ai-textanalytics-py

작성자 microsoft

azure-ai-textanalytics-py는 Python용 Azure AI Text Analytics 스킬입니다. 감성 분석, 개체 인식, 핵심 구문 추출, 언어 감지, PII 탐지, 의료 NLP에 도움이 됩니다. 앱, 노트북, 데이터 분석 워크플로에서 Azure 클라이언트 설정, 인증, 실전 텍스트 분석을 빠르게 시작해야 할 때 적합합니다.

Data Analysis

즐겨찾기 0GitHub 0