scanpy

作成者 K-Dense-AI

Pythonで単一細胞RNA-seqデータを解析するためのscanpy skillです。QC、正規化、PCA、UMAP/t-SNE、クラスタリング、マーカー遺伝子の発見、軌跡解析、論文品質のプロットに使えます。AnnDataを中心にした探索的なscRNA-seqワークフローに最適で、scanpyの使い方と導入手順もわかりやすく示します。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

編集スコア

このskillは78/100の評価で、汎用プロンプトではなく、すぐ使えるScanpyワークフローを求めるディレクトリ利用者に向いた有力候補です。リポジトリには、具体的なユースケース、実行しやすいワークフロー手順、十分な構成を備えた、本格的な単一細胞RNA-seq skillが含まれており、エージェントが迷いなく起動・適用しやすい内容になっています。

78/100

強み

QC、正規化、PCA/UMAP/t-SNE、クラスタリング、マーカー遺伝子、軌跡解析など、標準的なscRNA-seq作業に明確に絞られている。
有効なフロントマター、長文の本文、多数の見出し、コード例を含む充実したSKILL.mdがあり、実運用に使いやすい。
利用範囲の境界や関連skillの案内があり、探索的な単一細胞解析にはScanpyを選び、深層学習やAnnData固有の質問は別に回す判断がしやすい。

注意点

インストールコマンド、補助ファイル、外部参照は用意されていないため、導入は主に記載されたskill手順に依存する。
リポジトリはドキュメント中心に見えるため、パッケージ化された自動化や検証済みスクリプトではなく、ワークフローのガイダンスとして使う前提になる。

Scanpy Python Scientific Single Cell Bioinformatics Genomics Jupyter

概要

scanpy skill の概要

scanpy で何をするのか

scanpy skill は、Python によるシングルセル RNA-seq 解析のための skill です。QC、正規化、特徴選択、PCA、UMAP/t-SNE、クラスタリング、マーカー探索、軌道推定型の探索解析までを扱います。すでに AnnData オブジェクトを持っているか、作成できる状態で、深層学習モデルのワークフローではなく、Data Analysis に役立つ実用的な scanpy の手順を知りたいときに最適です。

どんな人に向いているか

scRNA-seq データを扱っている、未処理カウントを解析可能なオブジェクトに変換したい、あるいは解釈や論文化のために図やクラスター注釈を整えたい人に向いています。標準的な探索解析パイプラインを求めていて、一般的なバイオインフォマティクス入門ではなく scanpy の install と使用手順が必要な分析者に合っています。

何が違うのか

この repository は、広い理論概説ではなく、Scanpy の一般的な workflow を中心にしています。つまり、データ読み込み、前処理、埋め込み、クラスタリング、可視化に重点があります。また、用途の境界も明確です。深層生成モデルが必要なら scvi-tools を、主な論点が AnnData の構造や file formats なら anndata を起点にするほうが適しています。

scanpy skill の使い方

skill を install して動作確認する

通常の directory workflow に従って scanpy skill を install し、prompt を投げる前に skill file を開きます。

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

install 後は、まず scientific-skills/scanpy/SKILL.md を読み、そのあと file 内で参照されている各 section をたどってください。ここには追加の helper scripts や reference folders はないため、skill 本文そのものが主な正解ソースです。

解析に必要な入力を、解析可能な形で渡す

scanpy の prompt で最も効果が高いのは、data shape、format、目的を具体的に示すことです。入力が .h5ad なのか、10X output なのか、count matrix なのかを明記し、sample 数や batch 数、QC threshold が必要か、integration・clustering・plotting のどれが必要か、最終的にどんな output が欲しいかを含めてください。弱い prompt は「scRNA-seq data を解析して」です。よりよい prompt は「scanpy を使って 2 つの 10X datasets を読み込み、quality の低い cell を除外し、normalize して PCA/UMAP を計算し、複数の resolution で cluster し、各 cluster の marker genes を特定して」となります。

実用的な workflow に沿って進める

多くの task では、次の順で進めるのが基本です。data を読み込む、obs/var を確認する、quality の低い cells と genes を除外する、normalize/log-transform する、高変動 genes を選ぶ、scale して PCA を実行する、neighbors を作る、UMAP を計算する、cluster する、最後に markers を順位付けするか gene set を可視化する。すでに processed な AnnData を持っているなら、そのことを明示してください。そうすることで、skill が setup 手順を繰り返さず、まだ必要な analysis decision に集中できます。

先に読むべき箇所を押さえる

まず SKILL.md の冒頭を読み、そのあと setup、loading、preprocessing、plotting、downstream analysis を扱う usage section に進んでください。repository に特定の input formats や conventions が書かれている場合は、prompt でもその表記に正確に合わせます。目的は、model が code や analysis steps を書く前に、推測の余地を減らすことです。

scanpy skill の FAQ

scanpy は scRNA-seq 専用ですか？

はい、基本的にはその用途です。scanpy skill は single-cell transcriptomics の workflow、特に gene expression matrices の探索解析を中心にしています。bulk RNA-seq や、特化した single-cell deep-learning tools のほうが適している modeling tasks には向いていません。

すでにモデルにうまく指示できるなら、skill は必要ですか？

workflow 全体と必要な object が最初から分かっているなら、通常の prompt だけでも足りることがあります。scanpy skill が役立つのは、安定した analysis path を取りたい、抜け漏れを減らしたい、QC・前処理・クラスタリング・可視化の default を整えたいときです。

初心者でも使いやすいですか？

pipeline 自体が標準的で、実用的な scanpy usage に焦点が当たっているという意味では、初心者にも使いやすい skill です。ただし、基本的な Python、single-cell の概念、raw counts・normalized data・annotated metadata の違いは理解している前提です。

どんなときに使わないほうがいいですか？

主な課題が file conversion、AnnData の schema design、cell-state inference のための neural model 構築である場合は、scanpy をメイン skill にしないでください。そうしたケースでは、無理に scanpy で全工程を覆うより、別の skill や tool を使ったほうが結果はよくなります。

scanpy skill の改善方法

判断を変える入力を先に渡す

品質を大きく上げる鍵は、dataset size、organism、platform、batch structure、そして今どの analysis stage にいるのかを明示することです。scanpy usage では、ambient RNA の懸念があるか、doublet filtering が必要か、既知の marker genes のセットがあるかも伝えてください。これらは QC と解釈に直接影響します。

手順だけでなく、欲しい成果物を依頼する

「scanpy analysis をして」ではなく、preprocessing notebook、clustering workflow、marker-gene table、UMAP と violin plots を含む plotting block など、具体的な deliverable を指定してください。出力の着地点が明確だと、model は適切な scanpy guide の構成を選びやすくなり、不要な基礎説明を避けられます。

よくある失敗パターンに注意する

よくあるミスは、QC の前提を飛ばす、raw と normalized の layer を混ぜる、neighbors と scaling の選択を確認する前に clustering する、そして biological question を定義せずに結果だけを求めることです。初回の出力が一般的すぎるなら、入力 object の正確な名前、variable names、解析で支えたい判断を入れて修正してください。

1 つずつ制約を追加して改善する

最初の draft のあとで scanpy skill の出力を改善するときは、制約を 1 つだけ足すのが有効です。たとえば、「h5ad のみを使う」「integration はしない」「publication-quality plots にする」「obs に batch labels を保持する」といった指定です。これは大きく書き換えるよりも、workflow を安定させたまま、scanpy for Data Analysis の task に本当に必要な部分だけを絞り込めるため、たいてい有効です。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

channel-economics

作成者 alirezarezvani

channel-economics は、RevOps や事業責任者が direct、partner、marketplace、reseller、OEM などのチャネルを比較するための skill です。完全配賦の cost-to-serve、ROI の観点、制約を踏まえた channel-mix の推奨を扱えます。channel-economics の利用に役立つ Python scripts、data templates、ガイダンスも含まれています。

Revenue Operations

お気に入り 0GitHub 22.1k

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0