scikit-survival

작성자 K-Dense-AI

Python에서 생존 분석과 이벤트 발생 시간(time-to-event) 모델링을 위한 scikit-survival 스킬입니다. 검열 데이터, Cox 모델, 랜덤 서바이벌 포레스트, 그래디언트 부스팅, Survival SVM, 그리고 concordance index와 Brier score 같은 생존 지표를 다룰 때 이 가이드를 활용하세요.

Stars0

즐겨찾기0

추가됨2026년 5월 14일

카테고리Data Analysis

설치 명령어

npx skills add K-Dense-AI/claude-scientific-skills --skill scikit-survival

큐레이션 점수

이 스킬은 78/100점으로, 목록에 올릴 만한 가치가 있습니다. 디렉터리 사용자에게 바로 적용 가능한 scikit-survival 전용 생존 분석 워크플로를 명확하게 제공하며, 설치 근거로 삼기에도 충분한 수준입니다. 다만 아직 완전히 운영형이라고 보기는 어렵습니다. scikit-survival 관련 안내가 필요한 에이전트에는 확실한 후보이지만, 저장소에 보조 스크립트나 지원 리소스가 없어 일부 내용은 사용자가 직접 해석해야 할 수 있습니다.

78/100

강점

트리거가 명확합니다. 프론트매터에 검열된 생존 데이터, Cox 모델, Random Survival Forests, Gradient Boosting, Survival SVMs, 일반적인 생존 지표에 사용하라고 분명히 적혀 있습니다.
운영 범위가 충분합니다. 본문이 1.4만 자 이상으로 길고, 여러 헤딩과 워크플로 중심 내용이 있어 단순한 스텁이나 자리표시자 수준은 아닙니다.
목록 신뢰 신호가 좋습니다. 유효한 프론트매터, 플레이스홀더 표시 없음, 저장소/파일 참조가 있어 데모가 아닌 실제 스킬 페이지로 보입니다.

주의점

설치 명령, 스크립트, 참고 파일이 제공되지 않아, 설정과 사용 방법은 본문만 보고 추론해야 할 수 있습니다.
지원용 보조 구조가 제한적입니다. 저장소에 resources/rules/assets가 없어 단계적 안내가 약하고, 예외 상황에서의 적용 가능성도 덜 예측 가능합니다.

Python Scikit Learn Scientific Bioinformatics Statistics Survival Analysis

개요

scikit-survival 스킬 개요

scikit-survival 스킬은 Python에서 생존 분석과 time-to-event 모델링을 다룰 때 유용합니다. 특히 데이터에 검열(censoring)이 포함되어 있고, 일반적인 회귀만으로는 부족할 때 적합합니다. 이벤트 발생 시점을 모델링하거나, 그룹 간 위험도를 비교하거나, 검열을 반영한 지표로 예측 생존 모델을 평가해야 하는 분석가, 데이터 사이언티스트, ML 실무자에게 잘 맞습니다.

scikit-survival skill의 강점은 scikit-learn 생태계와의 높은 호환성입니다. 익숙한 estimator 스타일 워크플로를 유지하면서도 Cox 모델, random survival forests, gradient boosting, survival SVMs 같은 생존 분석 전용 방법을 적용할 수 있습니다. 설치를 고민 중이라면 핵심 질문은 단순합니다. 생존 분석에 대한 일반론이 아니라, 실제 검열된 결과를 다루는 실용적인 scikit-survival guide가 필요한가요?

이 스킬은 무엇을 위한 것인가

이 스킬은 이벤트까지 걸리는 시간을 예측하거나, 시간에 따른 위험도를 추정하거나, 구조화된 표 형식 데이터에서 생존 곡선을 비교해야 할 때 사용합니다. 임상, 신뢰성(reliability), 이탈(churn) 같은 scikit-survival for Data Analysis 활용 사례에 특히 잘 맞습니다. 이벤트 발생 시점이 중요하고 일부 결과가 완전하지 않을 때 강점이 있습니다.

어디에 가장 잘 맞는가

이 스킬은 이미 pandas, NumPy, scikit-learn 스타일 모델링을 쓰는 Python 워크플로에 가장 잘 맞습니다. “time-to-event 데이터가 있다”는 상태에서 모델, 평가 계획, 그리고 설명 가능한 결과물까지 이어가고 싶을 때 특히 유용합니다.

주요 도입 장벽

가장 큰 장벽은 데이터 준비와 지표 선택입니다. 생존 타깃은 일반적인 레이블이 아니며, 검열을 올바르게 표현해야 합니다. 이벤트 시간, 검열 상태, 그리고 의미 있는 평가 시점을 아직 정의하지 않았다면, 설치만으로는 문제를 해결할 수 없습니다.

scikit-survival 스킬 사용 방법

설치하고 올바른 파일부터 열기

디렉터리의 일반적인 스킬 설치 절차로 scikit-survival 스킬을 설치한 뒤, 먼저 SKILL.md를 여세요. 이 저장소에는 보조 스크립트나 추가 참고 폴더가 없으므로, 핵심 기준은 스킬 파일 자체와 현재 환경에 이미 적용된 저장소 전체 규칙입니다.

막연한 목표를 실행 가능한 요청으로 바꾸기

약한 요청은 “생존 데이터를 분석해줘”입니다. 더 강한 요청은 “scikit-survival을 사용해서 이 right-censored 데이터셋에 Cox 모델을 적합하고, random survival forest와 비교한 다음, hold-out set에서 concordance index와 time-dependent performance를 보고해줘”처럼 구체적입니다. 검열 방식, 이벤트 정의, feature 유형, 평가 지표를 명확히 적을수록 결과도 좋아집니다.

스킬에 필요한 입력

다음 정보를 제공하세요:

이벤트 유형과 검열 규칙
시간 컬럼과 이벤트 indicator
feature 컬럼과 제외할 항목
목표 시점 또는 예측 사용 사례
선호하는 모델 계열이 있다면 그것
해석 가능성, calibration, 속도 같은 제약

노트북이나 코드베이스에서 scikit-survival usage를 다룬다면, 코드만 원하는지, 설명만 원하는지, 아니면 둘 다 필요한지도 함께 말해 주세요.

실무 워크플로

먼저 데이터 형태 점검을 요청하고, 그다음 모델 선택 추천, 마지막으로 학습 및 평가 계획을 요청하는 순서가 좋습니다. 이런 순서는 피할 수 있는 오류를 줄여 줍니다. 생존 모델링은 데이터셋이 작은지, 검열이 심한지, 비선형성이 강한지, 아니면 랭킹보다 설명이 중요한지에 따라 선택이 달라지기 때문입니다.

scikit-survival 스킬 FAQ

scikit-survival은 초보자에게도 맞는가?

기본적인 Python과 몇 가지 지도학습 개념을 이미 알고 있다면 가능합니다. 다만 생존 타깃, 검열, 평가를 모두 명시적으로 다뤄야 하므로 “대충 넣고 돌려보는” 방식의 초보자 친화성은 낮습니다.

일반적인 프롬프트와 무엇이 다른가?

일반 프롬프트는 생존 분석을 개괄적으로 설명할 수 있지만, scikit-survival 스킬은 구체적인 구현 가이드가 필요할 때 더 유용합니다. 어떤 estimator를 쓸지, 결과를 어떻게 인코딩할지, 검열을 무시하지 않고 어떻게 예측을 평가할지를 더 직접적으로 다룹니다.

언제는 쓰지 말아야 하는가?

문제가 단순한 이진 분류, 일반 회귀, 또는 시간 개념이 없는 랭킹 작업이라면 사용하지 않는 편이 좋습니다. 이벤트 정의를 모르거나 time-at-risk 정보를 신뢰할 수 없는 경우에도 적합하지 않습니다.

scikit-learn 생태계와 맞는가?

맞습니다. 이것이 가장 큰 장점 중 하나입니다. 이미 익숙한 estimator 패턴에 의존하는 워크플로라면, scikit-survival install은 독립형 생존 분석 튜토리얼보다 scikit-learn식 실무에 더 잘 맞습니다.

scikit-survival 스킬 개선 방법

처음부터 생존 분석의 프레임을 명확히 주기

가장 유용한 입력은 모호함을 없애는 정보입니다. 무엇이 이벤트인지, 무엇이 검열인지, 어떤 시점의 예측이 중요한지를 먼저 알려 주세요. 이 세 가지가 있으면 스킬이 모델 형태와 평가 방식을 훨씬 더 잘 고를 수 있습니다.

무엇이 “좋은 결과”인지 지정하기

위험도 순위화가 중요한지, 생존 확률 추정이 중요한지, 해석 가능성이 중요한지, calibration이 중요한지 알려 주세요. Cox 모델과 random survival forest는 모두 타당할 수 있지만, 최적화하는 결과와 설명 방식은 다릅니다.

데이터 제약과 실패 위험을 함께 공유하기

표본 수가 적은지, 검열이 심한지, 결측치가 있는지, 범주형 인코딩이 필요한지, 이벤트 간 불균형이 있는지, 미래 정보가 섞일 leakage 위험이 있는지 언급하세요. 이런 세부 사항은 모델 계열보다 더 중요할 때가 많고, 잘못된 scikit-survival usage를 줄이는 데 도움이 됩니다.

하나의 구체적인 결과물부터 반복하기

첫 답변 이후에는 한 번에 하나씩 요청하세요. 예를 들어 feature 준비 체크리스트, 모델 비교 표, 또는 학습과 scoring 코드처럼요. 이렇게 하면 scikit-survival guide를 더 실행 가능하게 만들 수 있고, 막연하게 “더 자세히” 요청하는 것보다 다음 결과가 보통 더 빨리 좋아집니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

clickhouse-best-practices

작성자 ClickHouse

clickhouse-best-practices는 Database Engineering을 위한 ClickHouse 모범 사례 skill입니다. 스키마 설계, 쿼리 튜닝, insert 전략, 에이전트 연결성을 규칙 기반 권장사항으로 안내해, ClickHouse 워크플로에서 clickhouse-best-practices 사용을 더 쉽게 트리거하고 검토하며 인용할 수 있게 합니다.

Database Engineering

즐겨찾기 0GitHub 412

chdb-datastore

작성자 ClickHouse

chdb-datastore는 ClickHouse 기반 DataStore API를 활용해 빠른 데이터 분석을 지원하는 pandas 호환 skill입니다. 파일, 데이터베이스, 클라우드 커넥터를 지원하고, 서로 다른 소스 간 조인도 가능하며, pandas 스타일 워크플로우에 최소한의 코드 수정만으로 적용할 수 있습니다. 더 큰 데이터셋을 바로 분석할 수 있는 드롭인 분석 계층이 필요할 때 이 chdb-datastore 가이드를 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

sympy

작성자 K-Dense-AI

sympy 스킬로 Python에서 대수, 미적분, 행렬, 물리 공식, 수론, 기하, 코드 생성까지 정확한 기호 수학을 처리하세요. 식을 정확하게 유지하고, 적절한 SymPy 모듈을 고르며, 부동소수점 위주의 오류를 피하는 데 도움이 됩니다. 기호 워크플로와 데이터 분석용 sympy를 실용적으로 다루려는 사용자에게 특히 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

interpreting-culture-index

작성자 trailofbits

interpreting-culture-index는 Culture Index 설문, 프로필 내보내기 파일, 그리고 관련 채용·코칭 메모를 해석하는 데 도움을 줍니다. 역할 적합도, 팀 역학, 번아웃 위험, 지원자 피드백, 온보딩 계획, 갈등 중재에 이 interpreting-culture-index 스킬을 활용하세요. 화살표 상대 해석, 안티패턴 점검, 그리고 데이터 분석과 의사결정 지원에 유용한 실용적 결과물에 중점을 둡니다.

Data Analysis

즐겨찾기 0GitHub 5k

azure-search-documents-py

작성자 microsoft

azure-search-documents-py는 Python용 Azure AI Search 스킬로, 백엔드 개발에 필요한 설치, 인증, 인덱스 설계, 벡터 검색, 하이브리드 검색, 시맨틱 랭킹, 에이전틱 검색까지 다룹니다. 설정부터 실제 쿼리 패턴까지 실무 중심의 안내가 필요할 때 azure-search-documents-py 스킬을 사용하세요.

Backend Development

즐겨찾기 0GitHub 2.3k

gget

작성자 K-Dense-AI

gget은 CLI 또는 Python에서 20개 이상의 유전체 데이터베이스와 분석 도구에 빠르고 통합적으로 접근할 수 있는 생물정보학 스킬입니다. 유전자 정보, BLAST 관련 조회, AlphaFold 구조, 발현 데이터, 질병 연관성, enrichment 스타일 분석에 활용할 수 있습니다. 빠른 탐색과 gget 기반 데이터 분석 워크플로에 잘 맞습니다.

Data Analysis

즐겨찾기 0GitHub 0

torch-geometric

작성자 K-Dense-AI

PyTorch Geometric 그래프 신경망을 위한 torch-geometric 스킬 가이드입니다. torch-geometric 설치 도움, 사용법, 그래프 분류, 노드 분류, 링크 예측, 이종 그래프, 커스텀 MessagePassing 레이어, 그리고 머신러닝 워크플로에서 GNN 확장까지 다룰 때 활용하세요.

Machine Learning

즐겨찾기 0GitHub 21.4k

rdkit

작성자 K-Dense-AI

RDKit 스킬은 정밀한 화학정보학 워크플로를 지원합니다. SMILES, SDF, MOL, PDB, InChI 파싱부터 descriptor 계산, fingerprint 생성, substructure search, 반응 처리, 2D/3D 좌표 생성까지 다룹니다. 이 RDKit 가이드는 고급 제어, 사용자 정의 sanitization, 그리고 Data Analysis 워크플로에서의 RDKit 활용에 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

huggingface-vision-trainer

작성자 huggingface

huggingface-vision-trainer는 객체 탐지, 이미지 분류, SAM/SAM2 세그멘테이션 같은 비전 학습 작업에 사용할 Hugging Face 스킬을 설치하고 활용하는 데 도움을 줍니다. 데이터셋 준비, 클라우드 GPU 설정, 평가, Trackio 로깅, 결과를 Hub에 푸시하는 과정까지 다루며, 백엔드 자동화와 반복 가능한 학습 워크플로에 적합합니다.

Backend Development

즐겨찾기 0GitHub 10.4k

seo-dataforseo

작성자 AgriciDaniel

seo-dataforseo는 DataForSEO MCP 서버를 통해 Claude를 실시간 SEO 데이터와 연결합니다. SERP 확인, 키워드 리서치, 백링크, 온페이지 분석, 경쟁사 조사, 비즈니스 등록정보, AI 가시성 추적까지 지원합니다. 실제 검색 근거가 필요하고, 명확한 설치 안내와 실용적인 seo-dataforseo 사용법이 중요한 데이터 기반 워크플로에 가장 적합합니다.

Keyword Research

즐겨찾기 0GitHub 6.2k

pymc

작성자 K-Dense-AI

PyMC는 Python에서 확률적 모델을 구축, 적합, 점검, 비교하는 데 쓰는 베이지안 모델링 스킬입니다. pymc는 계층적 회귀, 다층 분석, 시계열, 결측값, 측정 오차, 그리고 LOO 또는 WAIC를 활용한 모델 비교에 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

pymatgen

작성자 K-Dense-AI

pymatgen은 결정 구조, 상평형도, 전자 구조, 파일 변환을 다루는 Python 재료과학 툴킷입니다. 이 pymatgen 스킬은 CIF, POSCAR, VASP, Materials Project 데이터를 활용하는 과학 워크플로를 지원합니다.

Scientific

즐겨찾기 0GitHub 0

geopandas

작성자 K-Dense-AI

Python 지리공간 벡터 데이터 분석을 위한 geopandas 스킬로, shapefiles, GeoJSON, GeoPackage 파일을 다룹니다. 공간 데이터를 읽고, 정리하고, 결합하고, 버퍼를 만들고, 자르고, 재투영하고, 내보내는 작업을 더 적은 추측으로 수행할 때 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0

analyzing-threat-intelligence-feeds

작성자 mukul975

analyzing-threat-intelligence-feeds는 CTI 피드를 수집하고, 지표를 정규화하며, 피드 품질을 평가하고, STIX 2.1 워크플로를 위한 IOC를 보강하는 데 도움을 줍니다. 이 analyzing-threat-intelligence-feeds 스킬은 위협 인텔 운영과 데이터 분석에 맞춰 설계되었으며, TAXII, MISP, 상용 피드를 실무적으로 다루는 방법을 제공합니다.

Data Analysis

즐겨찾기 0GitHub 0

azure-ai-textanalytics-py

작성자 microsoft

azure-ai-textanalytics-py는 Python용 Azure AI Text Analytics 스킬입니다. 감성 분석, 개체 인식, 핵심 구문 추출, 언어 감지, PII 탐지, 의료 NLP에 도움이 됩니다. 앱, 노트북, 데이터 분석 워크플로에서 Azure 클라이언트 설정, 인증, 실전 텍스트 분석을 빠르게 시작해야 할 때 적합합니다.

Data Analysis

즐겨찾기 0GitHub 0

chdb-sql

작성자 ClickHouse

chdb-sql은 서버 없이 Python에서 ClickHouse SQL을 실행할 수 있게 해주는 GitHub 스킬입니다. `chdb.query()`, `Session`, DB-API 연결, `file()`과 `s3()` 같은 테이블 함수, 매개변수화 쿼리, 로컬 파일과 외부 데이터 소스를 다루는 백엔드 개발 워크플로를 폭넓게 다룹니다.

Backend Development

즐겨찾기 0GitHub 0