K

scikit-survival

作成者 K-Dense-AI

Python で生存分析と time-to-event モデリングを行うための scikit-survival スキルです。打ち切りデータ、Cox モデル、Random Survival Forest、Gradient Boosting、Survival SVM、さらに concordance index や Brier score などの生存分析指標まで、導入判断に必要なポイントをこのガイドで確認できます。

スター0
お気に入り0
コメント0
追加日2026年5月14日
カテゴリーData Analysis
インストールコマンド
npx skills add K-Dense-AI/claude-scientific-skills --skill scikit-survival
編集スコア

このスキルの評価は 78/100 で、掲載候補として十分価値があります。ディレクトリ利用者がすぐに用途を見極められる、scikit-survival 専用の生存分析ワークフローが明確で、導入に足る情報量があります。一方で、まだ最も運用しやすい状態とは言えません。scikit-survival の案内を必要とするエージェントには堅実な候補ですが、リポジトリに補助スクリプトや付随リソースが見当たらないため、実際の適用ではある程度の手動解釈が必要です。

78/100
強み
  • 用途が明確でトリガーしやすい点が強みです。フロントマターに、打ち切りのある生存データ、Cox モデル、Random Survival Forest、Gradient Boosting、Survival SVM、一般的な生存指標に使うことが明記されています。
  • 運用範囲がしっかりしています。本文は 14k 文字超で、見出しも多く、ワークフロー中心の内容になっているため、単なる雛形やプレースホルダーではありません。
  • 掲載判断の信頼性があります。有効なフロントマターがあり、プレースホルダー表記もなく、リポジトリやファイル参照もあるため、実在するスキルページとして扱えます。
注意点
  • インストールコマンド、スクリプト、参照ファイルは提示されていないため、セットアップや使い方は本文から推測する場面が出てきます。
  • 支援用の土台が薄い点には注意が必要です。リポジトリ内の resources / rules / assets が 0 で、段階的な案内がしづらく、境界ケースでの導入可否が読みづらくなります。
概要

scikit-survival skill の概要

scikit-survival skill は、Python で survival analysis と time-to-event modeling を扱うための skill です。特に、データに censoring が含まれ、通常の回帰では足りない場合に役立ちます。イベント発生までの時間をモデル化したい、グループ間のリスクを比較したい、censoring を考慮した指標で予測 survival model を評価したい、といったニーズを持つアナリスト、データサイエンティスト、ML 実務者に向いています。

scikit-survival skill の強みは、scikit-learn のエコシステムと相性が良い点です。おなじみの estimator 形式のワークフローを使いながら、Cox model、random survival forest、gradient boosting、survival SVM などの survival 専用手法を適用できます。インストールするべきか迷っているなら、まず考えるべき問いはシンプルです。単なる survival analysis の一般論ではなく、実際の censored outcomes に使える実践的な scikit-survival ガイド が必要かどうかです。

この skill は何のためのものか

イベントまでの時間を予測したい、時間経過に伴うリスクを推定したい、構造化された表形式データから survival curve を比較したい、という場面で使います。臨床、信頼性、チャーンなど、イベント発生のタイミングが重要で、しかも一部の結果が未確定な scikit-survival for Data Analysis の用途に特に適しています。

どんな場面に最も合うか

この skill は、すでに pandas、NumPy、scikit-learn 風のモデリングを使っている Python ワークフローに最もよく合います。「time-to-event データはある」という状態から、モデル、評価計画、説明可能な出力まで一気に進めたいときに特に有用です。

導入の主なハードル

最大のハードルは、データ準備と指標選びです。survival のターゲットは単なるラベルではなく、censoring を正しく表現する必要があります。イベント時刻、censoring 状態、妥当な評価 horizon を定義する準備ができていないなら、インストールだけでは問題は解決しません。

scikit-survival skill の使い方

インストールして、まず適切なファイルを開く

通常の skill install の手順で scikit-survival skill をインストールし、最初に SKILL.md を開いてください。この repository には補助スクリプトや追加の reference フォルダがないため、主な信頼源は skill ファイルそのものと、環境内で既に使われている repository 全体の conventions です。

曖昧な目的を実用的な依頼に変える

弱い依頼は「survival data を分析して」です。より強い依頼は「この right-censored dataset に scikit-survival を使って Cox model を当て、random survival forest と比較し、concordance index と held-out set での time-dependent performance を報告して」です。censoring、event の定義、feature の種類、評価指標をどれだけ明示できるかで、出力の質は大きく変わります。

この skill に渡すべき入力

以下を伝えてください。

  • event の種類と censoring rule
  • time column と event indicator
  • feature columns と除外対象
  • 予測 horizon か利用目的
  • 使いたい model family があればその指定
  • 解釈性、calibration、速度などの制約

Notebook や codebase で scikit-survival usage をしているなら、コードだけ欲しいのか、説明も欲しいのか、両方必要なのかも伝えるとよいです。

実践的な進め方

最初はデータ形状の確認、その次にモデル選定の提案、最後に学習と評価の計画を依頼するのが効果的です。survival modeling の選択は、データが小さいか、censoring が多いか、非線形性が強いか、説明目的かランキング目的かによって変わるため、この順番にすると避けられるミスが減ります。

scikit-survival skill の FAQ

scikit-survival は初心者にも向いているか

はい。基本的な Python と、ある程度の supervised learning を知っていれば使えます。ただし、「とりあえず試す」感覚の初心者向けではありません。survival target、censoring、評価方法をすべて明示的に扱う必要があるからです。

普通のプロンプトと何が違うのか

普通のプロンプトでも survival analysis を一般論として説明することはできますが、scikit-survival skill は、どの estimator を使うか、outcome をどう encode するか、censoring を無視せずにどう評価するかといった、実装に直結する案内が必要なときにより役立ちます。

どんな場合は使わないほうがいいか

問題が単純な binary classification、通常の regression、あるいは time に基づかない ranking task だけなら使うべきではありません。また、event definition が分からない、あるいは time-at-risk 情報の信頼性が低い場合も不向きです。

scikit-learn エコシステムに合っているか

はい。それが大きな利点の一つです。普段からおなじみの estimator パターンに依存したワークフローなら、scikit-survival install は standalone の survival tutorial よりも scikit-learn 風の実務に沿いやすく、選ぶ価値があります。

scikit-survival skill を改善するには

まず survival の前提をはっきり渡す

最も役立つ入力は、曖昧さをなくす情報です。何を event とするのか、何が censored なのか、どの prediction time が重要なのか。この3点がそろえば、skill は model form と evaluation の選び方をかなり適切に判断できます。

「良い」の定義を指定する

リスクの順位付けを重視するのか、survival probability の推定を重視するのか、解釈性なのか、calibration なのかを伝えてください。Cox model と random survival forest はどちらも有効ですが、最適化するものも、出力される説明も異なります。

データの制約と失敗リスクを共有する

サンプルサイズの小ささ、censoring の多さ、missing values、categorical encoding、event 間の class imbalance、未来情報による leakage のリスクなども伝えてください。こうした情報は model family より重要なことが多く、誤解を招く scikit-survival usage を避ける助けになります。

具体的な出力を一つずつ依頼して改善する

最初の回答のあとに、feature-prep checklist、model comparison table、fitting と scoring の code など、一度に一つの成果物だけを依頼してください。そうすると scikit-survival ガイド が実務に直結しやすくなり、「もっと詳しく」とだけ頼むよりも次の結果が早く改善しやすくなります。

評価とレビュー

まだ評価がありません
レビューを投稿
このスキルの評価やコメントを投稿するにはサインインしてください。
G
0/10000
新着レビュー
保存中...