imaging-data-commons
作成者 K-Dense-AIimaging-data-commons は、idc-index を使って NCI Imaging Data Commons の公開がん画像データを検索・ダウンロードするためのスキルです。CT、MR、PET、病理データセットにまたがる imaging-data-commons の利用に向いており、メタデータ検索、ブラウザプレビュー、ライセンス確認、AI 学習やデータ分析のワークフローまでカバーします。認証は不要です。
このスキルの評価は 82/100 です。IDC のがん画像データにアクセスしたいユーザー向けとして、ディレクトリ掲載に十分適した内容です。リポジトリには、エージェントがスキルを正しく起動し、idc-index と BigQuery / DICOMweb / クラウドストレージの使い分けを判断し、一般的なワークフローを迷い少なく実行するための実務情報がそろっています。
- トリガー条件が明確です。フロントマターに、NCI IDC の公開がん画像データを検索・ダウンロードする用途であり、認証不要であることがはっきり書かれています。
- ワークフローの深さが十分です。SKILL.md は大きく、CLI、臨床データ、DICOMweb、BigQuery、クラウドストレージ、病理、インデックステーブル、SQL パターンを扱う 10 本の参考ガイドで補強されています。
- 実務上の有用性が高いです。バージョン固定と、各アクセス手段を使い分ける明示的な指針があり、実際の作業でエージェントが迷いにくくなっています。
- SKILL.md にインストールコマンドがないため、セットアップ手順は参考資料やコードスニペットから推測する必要がある場合があります。
- このリポジトリはスクリプト駆動というより参考資料中心です。そのため、高度なワークフローでは、複数ドキュメントをまたいで手順を組み立てる必要が残ることがあります。
imaging-data-commons skill の概要
imaging-data-commons ができること
imaging-data-commons skill は、idc-index を使って NCI Imaging Data Commons の公開がん画像データを検索・ダウンロードするのを支援します。カスタムのデータ取り込み基盤を先に作らずに、放射線画像や病理コホートを必要とする研究者、ML エンジニア、アナリストに最適です。
どんな人がインストールすべきか
メタデータで研究を探したい、利用可能なコレクションを確認したい、ライセンスをチェックしたい、ブラウザでデータをプレビューしたい、AI 学習や分析のためにデータを取得したい、という場合は imaging-data-commons skill を使ってください。認証なしで使える公開 IDC データを扱いたいときに特に相性が良い skill です。
何が違うのか
この skill は単なる「医用画像を探す」ための汎用プロンプトではありません。IDC のデータモデル、バージョニング、アクセスパターンに沿っているため、CT、MR、PET、デジタル病理のどこをどう辿るべきかを具体的に案内できます。どこを検索するか、何を डाउनलोड するか、インデックステーブルを使うべきか、より広いアクセス方法を使うべきか、といった迷いを減らせるのが大きな価値です。
imaging-data-commons skill の使い方
imaging-data-commons をインストールする
まずディレクトリパッケージから imaging-data-commons skill をインストールし、その後 skill ファイルを開いて、リンクされている参照先に従ってください。
npx skills add K-Dense-AI/claude-scientific-skills --skill imaging-data-commons
まず適切な入力を与える
imaging-data-commons usage のワークフローは、漠然と「IDC を探索したい」ではなく、具体的な目的を与えたときに最もよく機能します。良い入力の例としては、モダリティ、がん種、コレクション名、必要な出力形式、メタデータだけでよいのか実ファイルのダウンロードが必要なのか、などがあります。
強いプロンプトの例:
「imaging-data-commons skill を使って、臨床ラベル付きの公開 CT 肺がんコレクションを見つけ、最適な collection ID と小規模な試験コホートのダウンロード手順を示してください。」
まず読むべきファイル
実務的に進めるなら、まず SKILL.md を読み、その後 references/use_cases.md、references/cli_guide.md、references/index_tables_guide.md、そしてタスクに合うドメインガイド、たとえば references/digital_pathology_guide.md や references/cloud_storage_guide.md を確認してください。これらのファイルには、CLI、SQL パターン、インデックステーブル、BigQuery、DICOMweb、直接のクラウドストレージのどれを使うべきかが書かれています。
先に判断してから動く
良い imaging-data-commons guide の進め方は、まずデータ種別を特定し、条件に合う最小限の複雑さのアクセス方法を選び、コレクション単位のライセンスを確認し、その上で必要な部分だけを検索またはダウンロードすることです。データ抽出タスクでは、ダウンロードに進む前に、該当する collection や series のフィルタ、想定ファイル数、推奨アクセス経路を skill に返させるとよいでしょう。
imaging-data-commons skill の FAQ
imaging-data-commons は放射線画像専用ですか?
いいえ。imaging-data-commons skill は、スライド顕微鏡画像、セグメンテーション、関連メタデータへのアクセスを含む、放射線画像と病理の両方のワークフローをカバーしています。病理が中心のタスクでは、すべてに同じ検索パターンが通用すると考えず、該当する参照ガイドを使ってください。
クラウド認証情報や特別なアクセス権は必要ですか?
通常は不要です。imaging-data-commons のインストールと基本的な利用フローは公開データへのアクセスを前提としており、多くの一般的な検索は認証を必要としません。BigQuery やクラウドネイティブなワークフローなど、特定の経路でだけ追加設定が必要になることがあります。
どんな場合に使わないほうがいいですか?
私的な病院データ、相互に関係のない複数ソースにまたがる完全に正規化された臨床データ、あるいは一行で済むような一般的な画像検索が必要なら、使わないほうがよいです。また、メタデータ探索、ブラウザでの可視化、実ダウンロードの自動化のどれが必要かまだ決めていない場合も、適した選択ではありません。
初心者向けですか?
はい。ただし、具体的な目的を先に示し、アクセス方法の選定は skill に任せるのが前提です。初心者がつまずきやすいのは「IDC の全部を見せて」と頼むときで、病気領域、モダリティ、最終的な用途を指定すると結果は大きく良くなります。
imaging-data-commons skill の改善方法
目標をもっと絞って伝える
imaging-data-commons usage を最も早く改善する方法は、コホートの境界条件と欲しい出力を最初に明示することです。「IDC のデータを探して」よりも、「NSCLC の公開 PET-CT series を 50 件探し、臨床ラベル付きのコレクションを優先して、ダウンロード可能な候補リストをください」のほうがずっと有効です。
経路を変える制約を入れる
ライセンス制限、商用利用の可否、保存容量の上限、CLI・Python・SQL・ブラウザベースのどれを好むかを伝えてください。これらの制約によって、idc-index、BigQuery、DICOMweb、直接のクラウドストレージのどれを使うべきかが決まるからです。
2段階の出力を求める
imaging-data-commons for Data Analysis をより良くするには、まず discovery、次に実行の詳細、という 2 段階で出力を求めてください。たとえば、関連コレクション、推奨フィルタ、そして正確な command や query の骨組みを先に出させます。そうすると手戻りが減り、大きなデータセットをダウンロードする前に最初の回答を検証しやすくなります。
勘ではなく根拠で反復する
最初の結果が広すぎるなら、モダリティ、解剖学部位、ライセンス、コレクション名で絞り込み、より小さなコホートか別のアクセス経路を求めてください。改善のサインとして最も重要なのは「もっと詳しく」ではなく、取得対象がより明確になり、discovery から download への受け渡しがはっきりすることです。
