pydeseq2

作成者 K-Dense-AI

pydeseq2は、バルクRNA-seqの差次的遺伝子発現解析に使えるPython版DESeq2スキルです。条件比較、単因子・多因子デザインの当てはめ、Wald検定とFDR補正、さらにpandasやAnnDataのワークフローでのvolcano plotやMA plotの作成に役立ちます。

スター0

お気に入り0

追加日2026年5月14日

カテゴリーData Analysis

インストールコマンド

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

編集スコア

このスキルは80/100点で、掲載に値します。リポジトリを見ると、エージェントがいつ使うべきかを判断し、実際のPyDESeq2による差次的発現解析ワークフローをたどり、汎用プロンプトより少ない試行錯誤で適用できるだけの材料がそろっています。完璧に整備されたパッケージではありませんが、運用に足る内容があり、バルクRNA-seq解析ユーザーにとって導入価値は十分です。

80/100

強み

トリガー判定が強い: フロントマターと「When to Use This Skill」で、DESeq2、差次的発現、バルクRNA-seqのカウントデータ、PyDESeq2が明確に対象化されています。
実務的なワークフロー: 本文には、pandas、DeseqDataSet、DeseqStats、フィルタリング、Wald検定、FDR補正まで含む具体的なクイックスタートがあります。
エージェントにとって使いやすい: 単因子・多因子デザイン、バッチ/共変量の扱い、apeGLM shrinkage、pandas/AnnData連携までカバーしています。

注意点

インストールコマンドやサポートファイルはないため、環境構築やセットアップは利用者側で補う必要がある場合があります。
リポジトリにはexperimental/test系の संकेतがあり、参照資料や補助アセットを伴わない単独のSKILL.md構成に見えます。

Python Pandas Bioinformatics Genomics Dataset

概要

pydeseq2 スキルの概要

pydeseq2 は何のためのものか

pydeseq2 は、bulk RNA-seq の count データを使った differential gene expression 分析のための Python スキルです。生のカウント値とサンプルメタデータから、DE の結果、fold change、調整済み p 値、さらに volcano plot や MA plot などの定番探索出力までまとめて扱えます。

どんな人に向いているか

pydeseq2 スキルは、Python で DESeq2 風の解析を行いたい人、multi-factor design が必要な人、あるいは differential expression を pandas/AnnData ベースのワークフローに組み込みたい人に向いています。すでに count matrix と臨床・実験メタデータを持っている解析者には相性が良い一方、RNA-seq の前処理を一式まるごと欲しい人には向きません。

何が便利なのか

pydeseq2 の主な価値は、DESeq2 のために R へ移る必要がある Python ユーザーの“翻訳コスト”を下げられることです。Wald 検定、多重検定補正、必要に応じた apeGLM shrinkage に対応しており、再現性のある notebook や pipeline で実務的に使いやすいワークフローを備えています。

pydeseq2 スキルの使い方

pydeseq2 をインストールする

まず Claude の skill set にこのスキルを追加し、その後でプロンプトを出す前に skill ファイルを開いてください。
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

pydeseq2 のインストールやセットアップを判断する際は、環境に RNA-seq の count table、sample metadata、そしてワークフローに必要な Python パッケージがすでに揃っているかを確認してください。このスキルが最も役立つのは、サンプルごとの gene count と design formula か grouping variable を渡せる場合です。

適切な入力から始める

pydeseq2 をうまく使うには、まず入力構造をきれいに整えることが重要です。

サンプルを行、gene を列にした count matrix
sample ID で index 化された metadata
モデルに入れたい明確な condition 列と、必要なら batch 列や共変量列
treated vs control のような、はっきりした比較対象

弱いプロンプトの例: 「RNA-seq データで differential expression をやってください。」
強いプロンプトの例: 「24 サンプルの bulk RNA-seq count matrix に pydeseq2 を使い、treated と control を比較し、batch を共変量として入れ、極端に低 count の gene を除外したうえで、有意 gene と volcano/MA plot のコードを返してください。」

先に読むべきファイル

まず SKILL.md を見て、ワークフローと想定される解析手順を確認してください。次に README.md、AGENTS.md、metadata.json、そして存在する場合は rules/、resources/、references/、scripts/ フォルダも確認します。このリポジトリでは実務上の主な手がかりは SKILL.md にあるため、補助ファイルが必ずあるとは考えないでください。

pydeseq2 をうまく使う

pydeseq2 は単なるコード生成ではなく、解析手法として扱ってください。モデルには次の情報を伝えるとよいです。

どの organism と assay か
サンプルがどうグループ分けされているか
single-factor design か multi-factor design か
shrinkage、ranking、visualization が必要か
dataframe、notebook cells、再利用可能な script など、必要な出力形式は何か

こうしておくと、モデルが design、filtering、解釈の手順を推測で決めるのではなく、適切に選べるため、pydeseq2 の精度と実用性が上がります。

pydeseq2 スキルの FAQ

pydeseq2 は DESeq2 ユーザーだけのものか

いいえ。Python で DESeq2 風の differential expression 解析をしたい人なら誰でも使えます。特に pandas、scanpy、AnnData で作業していて、解析をひとつのスタックに保ちたい人に向いています。

使うには完璧なプロンプトが必要か

いいえ、ただし曖昧なプロンプトだと一般的な解析コードになりがちです。pydeseq2 スキルは、count table の形、知りたい比較、既知の交絡因子を伝えるほど、うまく機能します。

pydeseq2 は初心者向きか

RNA-seq の count と実験デザインの基本をすでに理解しているなら、初心者にも使いやすいです。一方で、alignment、quantification、あるいは differential expression 前の upstream QC から助けが必要なら、やや不向きです。

pydeseq2 を使わないほうがよいのはどんなときか

single-cell differential expression、raw counts を伴わない normalized expression、または transcriptomics の end-to-end パイプライン全体が必要なワークフローには使わないでください。また、gene-level count data がなく、必要なのが統計的な解釈そのものの場合も適切ではありません。

pydeseq2 スキルを改善する方法

生物学的な背景をもっと具体的に伝える

pydeseq2 の結果が最も良くなるのは、ファイル名だけでなく研究デザインまで説明したプロンプトです。response variable、control condition、batch effect、replicate 数、さらに gene ranking、plot code、解釈のどれが欲しいかを含めてください。

重要な解析判断を明示する

低 count の gene をどう扱うか、multi-factor model を使うか、effect size に shrinkage が必要かをスキルに伝えてください。これらの選択は pydeseq2 の出力に大きく影響し、研究に合わない generic default を避けるのに役立ちます。

再利用できる出力を頼む

「結果だけ」を求めるのではなく、保存可能な dataframe schema、plot 用の snippet、あるいは notebook でそのまま使えるワークフローを依頼してください。たとえば、「model を fit し、adjusted p-value を抽出し、log2 fold change と padj を含む significant genes の CSV を書き出す pydeseq2 コードを返してください」のように指定します。

最終結果だけでなく診断から改善する

最初の実行結果に違和感があるなら、QC 重視の確認を依頼してください。たとえば、sample clustering、count filtering の根拠、残った gene 数、design formula に confounding がないか、などです。結果が弱い、あるいは想定より極端に少ないときに、Data Analysis としての pydeseq2 を改善する最短ルートです。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

sympy

作成者 K-Dense-AI

sympyスキルを使って、Pythonでの厳密なシンボリック計算を行えます。代数、微積分、行列、物理式、数論、幾何、コード生成まで幅広く対応。式を厳密に保ち、適切なSymPyモジュールを選び、浮動小数点中心の誤りを避けるのに役立ちます。シンボリックなワークフローやData Analysisでのsympy活用を実践的に学びたい人に最適です。

Data Analysis

お気に入り 0GitHub 21.4k

interpreting-culture-index

作成者 trailofbits

interpreting-culture-index は、Culture Index のサーベイ、プロフィール書き出し、関連する採用・コーチングメモの解釈を支援します。役割適合、チームの力学、バーンアウトリスク、候補者の振り返り、オンボーディング計画、対立の仲裁にこの interpreting-culture-index skill を使ってください。矢印の相対関係を基準に読む考え方、アンチパターンの確認、データ分析と意思決定支援につながる実践的な出力を重視しています。

Data Analysis

お気に入り 0GitHub 5k

azure-search-documents-py

作成者 microsoft

azure-search-documents-py は、Python 向けの Azure AI Search スキルです。バックエンド開発を対象に、インストール、認証、インデックス設計、ベクトル検索、ハイブリッド検索、セマンティックランキング、エージェント的検索までをカバーします。セットアップから実用的なクエリパターンまで、具体的な指針が必要なときにこの azure-search-documents-py スキルを使ってください。

Backend Development

お気に入り 0GitHub 2.3k

gget

作成者 K-Dense-AI

ggetは、CLIまたはPythonから20以上のゲノムデータベースと解析ツールへ高速かつ統一的にアクセスできる生物情報学スキルです。遺伝子情報、BLAST関連の検索、AlphaFold構造、発現データ、疾患関連、エンリッチメント系の解析に使えます。素早い探索や、ggetを使ったData Analysisワークフローに向いています。

Data Analysis

お気に入り 0GitHub 0

torch-geometric

作成者 K-Dense-AI

PyTorch Geometric のグラフニューラルネットワーク向け torch-geometric スキルガイドです。torch-geometric のインストール支援、torch-geometric の使い方、グラフ分類、ノード分類、リンク予測、異種グラフ、カスタム MessagePassing レイヤー、Machine Learning ワークフローでの GNN のスケーリングに役立ちます。

Machine Learning

お気に入り 0GitHub 21.4k

rdkit

作成者 K-Dense-AI

rdkit skill は、SMILES、SDF、MOL、PDB、InChI の解析、記述子の計算、フィンガープリント生成、部分構造検索、反応処理、2D/3D 座標の生成など、精密な化学情報ワークフローを支援します。高度な制御、カスタムサニタイズ、Data Analysis ワークフローでの rdkit 活用を確認したい場合に使えるガイドです。

Data Analysis

お気に入り 0GitHub 21.4k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

seo-dataforseo

作成者 AgriciDaniel

seo-dataforseo は、DataForSEO MCP サーバーを通じて Claude をライブの SEO データにつなぎ、SERP 確認、キーワード調査、被リンク、オンページ分析、競合調査、ビジネスリスティング、AI 可視性トラッキングを可能にします。実際の検索根拠が必要で、導入判断をしやすい明確な手順と、実務に使える seo-dataforseo の活用法を求めるデータ重視のワークフローに最適です。

Keyword Research

お気に入り 0GitHub 6.2k

pymc

作成者 K-Dense-AI

PyMCは、Pythonでベイズモデルを構築・推定・検証・比較するためのスキルです。pymcは、階層回帰、マルチレベル分析、時系列、欠損データ、測定誤差、LOOやWAICによるモデル比較に使えます。

Data Analysis

お気に入り 0GitHub 0

pymatgen

作成者 K-Dense-AI

pymatgen は、結晶構造、相図、電子構造、ファイル変換を扱う Python の材料科学向けツールキットです。この pymatgen スキルは、CIF、POSCAR、VASP、Materials Project のデータを使う科学ワークフローを支援します。

Scientific

お気に入り 0GitHub 0

geopandas

作成者 K-Dense-AI

Pythonでのgeopandasによる地理空間ベクターデータ分析向けスキルです。shapefiles、GeoJSON、GeoPackageファイルを扱えます。空間データの読み込み、整形、結合、バッファ作成、クリップ、再投影、書き出しを、迷いを少なく進められます。

Data Analysis

お気に入り 0GitHub 0

analyzing-threat-intelligence-feeds

作成者 mukul975

analyzing-threat-intelligence-feeds は、CTI フィードの取り込み、インジケーターの正規化、フィード品質の評価、STIX 2.1 ワークフロー向けの IOC 強化を支援します。脅威インテリジェンス運用とデータ分析向けに設計された analyzing-threat-intelligence-feeds スキルで、TAXII、MISP、商用フィードを使う実務に役立つガイドが含まれています。

Data Analysis

お気に入り 0GitHub 0

azure-ai-textanalytics-py

作成者 microsoft

azure-ai-textanalytics-py は、Python で Azure AI Text Analytics を扱うための skill です。感情分析、エンティティ認識、キーフレーズ抽出、言語判定、PII 検出、医療分野の NLP に対応します。Azure クライアントのセットアップ、認証、実践的なテキスト分析を、アプリ、ノートブック、データ分析ワークフローですばやく始めたいときに向いています。

Data Analysis

お気に入り 0GitHub 0

chdb-sql

作成者 ClickHouse

chdb-sql は、サーバーなしで Python から ClickHouse SQL を実行するための GitHub スキルです。`chdb.query()`、`Session`、DB-API 接続、`file()` や `s3()` などのテーブル関数、パラメータ化クエリ、ローカルファイルや外部データソースを使ったバックエンド開発ワークフローをカバーします。

Backend Development

お気に入り 0GitHub 0