pydeseq2

作者 K-Dense-AI

pydeseq2 是一個用於 bulk RNA-seq 差異基因表現分析的 Python DESeq2 技能。可用來比較不同條件、建立單因子或多因子設計、套用 Wald 檢定與 FDR 校正，並在 pandas 與 AnnData 工作流程中產生 volcano 或 MA 圖。

Stars0

評論0

加入時間2026年5月14日

分類数据分析

安裝指令

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

編輯評分

這個技能評分 80/100，值得收錄。此 repository 提供了足夠的證據，讓 directory 使用者判斷 agent 何時該用它、如何跟著真實的 PyDESeq2 差異表現流程操作，以及比起通用提示更少猜測地完成分析。它不是最完整的封裝，但具備相當實用的操作內容，對 bulk RNA-seq 分析使用者有明確的導入價值。

80/100

亮點

觸發性強：frontmatter 與「何時使用這個技能」明確鎖定 DESeq2、差異表現、bulk RNA-seq counts 與 PyDESeq2。
流程具體：技能內容包含可直接上手的 quick-start，涵蓋 pandas、DeseqDataSet、DeseqStats、篩選、Wald 檢定與 FDR 校正。
對 agent 很有幫助：涵蓋單因子與多因子設計、batch/covariate 處理、apeGLM shrinkage，以及與 pandas/AnnData 的整合。

注意事項

未提供安裝指令或支援檔案，因此使用者可能需要自行推斷環境與設定細節。
該 repository 帶有 experimental/test 訊號，而且看起來只有單一 `SKILL.md`，沒有參考資料或輔助資產。

Python Pandas 生物信息学基因组学数据集

總覽

pydeseq2 技能概覽

pydeseq2 的用途

pydeseq2 是一個用於 bulk RNA-seq count data 差異基因表現分析的 Python 技能。它能幫你從原始 counts 和 sample metadata 一路做到 DE 結果、fold change、校正後 p-value，以及像 volcano plot 和 MA plot 這類常見的探索性輸出。

誰適合使用

如果你想在 Python 裡做 DESeq2 風格的分析、需要多因子設計，或想把差異表現分析整合進 pandas／AnnData 工作流程，就適合使用 pydeseq2 技能。它很適合已經有 count matrix 與臨床或實驗 metadata 的分析者；如果你要的是完整的 RNA-seq 前處理管線，這個技能就不是最佳選擇。

它的實用價值在哪裡

pydeseq2 的主要價值，在於它能降低 Python 使用者切換到 R 跑 DESeq2 的轉譯成本。它支援 Wald test、多重檢定校正、可選的 apeGLM shrinkage，還提供適合 notebook 或 pipeline 可重現使用的工作流程。

如何使用 pydeseq2 技能

安裝 pydeseq2

先把技能安裝到你的 Claude skill set，然後在提問前打開技能檔案：
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

在決定 pydeseq2 的安裝與設定前，先確認你的環境已經具備 RNA-seq count table、sample metadata，以及你的工作流程所需的 Python 套件。當你能提供每個 sample 的基因 counts，並且有設計公式或分組變數時，這個技能最有用。

從正確的輸入開始

要把 pydeseq2 用好，關鍵是先整理好輸入結構：

count matrix：sample 在列、gene 在欄
metadata：以 sample ID 為索引
明確的 condition 欄位，以及模型中要納入的 batch 或 covariate 欄位
清楚的比較目標，例如 treated vs control

較弱的提示會寫：「幫我對我的 RNA-seq 資料做差異表現分析。」
較好的提示會寫：「請用 pydeseq2 分析一個 bulk RNA-seq count matrix，共 24 個 samples，比較 treated vs control，把 batch 當作 covariate，過濾非常低 count 的 genes，並輸出顯著基因與 volcano/MA plot 程式碼。」

先讀這些檔案

先從 SKILL.md 開始，了解工作流程與預期的分析步驟。接著再檢查 README.md、AGENTS.md、metadata.json，以及任何存在的 rules/、resources/、references/ 或 scripts/ 資料夾。就這個 repository 而言，最重要的實作訊號在 SKILL.md，不要預設一定還有其他 helper 檔案。

把 pydeseq2 用對

把 pydeseq2 當作一種分析方法，而不只是程式碼產生器。你要明確告訴模型：

你的 organism 和 assay 是什麼
sample 怎麼分組
需要單因子還是多因子設計
是否要 shrinkage、排名或視覺化
你需要的輸出格式，例如 dataframe、notebook cells，或可重用的 script

這會讓 pydeseq2 的使用效果更好，因為模型就能選對設計、過濾與解讀步驟，而不是憑空猜測。

pydeseq2 技能 FAQ

pydeseq2 只適合 DESeq2 使用者嗎？

不是。任何想在 Python 裡做出 DESeq2 類型差異基因表現分析的人都可以用。尤其適合本來就使用 pandas、scanpy 或 AnnData，並且想把分析維持在同一套技術堆疊中的人。

使用它一定要寫出完美提示嗎？

不需要，但太模糊的提示通常只會得到很制式的分析程式碼。pydeseq2 技能在你提供 count table 的形狀、關心的比較，以及已知的 confounders 時，效果會最好。

pydeseq2 適合初學者嗎？

如果你已經了解 RNA-seq counts 和實驗設計的基本概念，它算是對初學者友善。若你還需要先處理 alignment、quantification，或在差異表現之前做上游 QC，這就比較不適合。

什麼情況下不該用 pydeseq2？

不要把它用在 single-cell differential expression、沒有 raw counts 的 normalized expression，或需要完整端到端 transcriptomics pipeline 的工作流程。若你真正需要的是統計解讀，而不是 gene-level count data，本技能也不是最合適的選擇。

如何改進 pydeseq2 技能

提供更好的生物學背景

pydeseq2 最好的結果，通常來自能說清楚研究設計的提示，而不只是檔名。請加入 response variable、control condition、batch effect、replicate 數量，以及你是否需要 gene ranking、plot code 或解讀。

明確指定你在意的分析決策

告訴技能要怎麼處理 low-count genes、是否使用多因子模型，以及你是否需要對 effect size 做 shrinkage。這些選擇會實質影響 pydeseq2 的輸出，也能避免落入不一定符合你研究的預設值。

要求可重複使用的輸出

不要只問「結果」，而是要求可儲存的 dataframe schema、繪圖片段，或適合 notebook 直接使用的流程。例如：「請回傳 pydeseq2 程式碼，完成模型擬合、提取 adjusted p-values，並將包含 log2 fold change 與 padj 的顯著基因輸出成 CSV。」

從診斷開始迭代，不要只看最後命中

如果第一次跑出來的結果不太對，請改問偏向 QC 的檢查：sample clustering、count filtering 的理由、保留了多少 genes，或 design formula 是否有 confounding。當結果偏弱或明顯過少時，這是改善 pydeseq2 for Data Analysis 的最快方法。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一個相容 pandas 的技能，透過 ClickHouse 支援的 DataStore API 提供快速資料分析。它支援檔案、資料庫與雲端連接器、跨來源 JOIN，以及只需極少程式碼變更的 pandas 風格工作流程。當你需要一個可直接替換、用於較大資料集的分析層時，可以使用這份 chdb-datastore 指南。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中進行精確的符號數學運算，涵蓋代數、微積分、矩陣、物理公式、數論、幾何與程式碼生成。它能幫助你維持表達式的精確性、選對 SymPy 模組，並避免過度依賴浮點數造成的錯誤。最適合需要實用 sympy 指南來處理符號工作流程，以及在 Data Analysis 中使用 sympy 的使用者。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可協助解讀 Culture Index 問卷、個人檔案匯出內容，以及相關的招募或教練筆記。這個 interpreting-culture-index 技能適合用於職務適配、團隊動態、倦怠風險、候選人回饋簡報、入職規劃與衝突調解。它強調依箭頭相對位置來閱讀、檢查反模式，以及產出實用的分析結果，支援資料分析與決策判斷。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是 Python 版的 Azure AI Search 技能，適合後端開發，涵蓋安裝、驗證、索引設計、向量搜尋、混合搜尋、語意排序與 agentic retrieval。當你需要從環境設定一路到可運作的查詢模式的實作指引時，適合使用 azure-search-documents-py 技能。

後端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一個生物資訊技能，可透過 CLI 或 Python 快速、統一地存取 20+ 個基因組資料庫與分析工具。適合查詢基因資訊、BLAST 相關資料、AlphaFold 結構、表現量資料、疾病關聯，以及進行類 enrichment 分析。它很適合快速探索，以及 gget for Data Analysis 工作流程。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

適用於 PyTorch Geometric 圖神經網路的 torch-geometric 技能指南。可用來取得 torch-geometric 安裝協助、torch-geometric 使用方式、圖分類、節點分類、連結預測、異質圖、自訂 MessagePassing 層，以及為 Machine Learning 工作流程擴展 GNN。

Machine Learning

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能可協助你精準處理化學資訊工作流程：解析 SMILES、SDF、MOL、PDB 與 InChI；計算描述子；產生指紋；執行子結構搜尋；處理反應；以及建立 2D/3D 座標。這份 rdkit 指南適合進階控制、自訂清理，以及用 rdkit 進行 Data Analysis 工作流程。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 可協助你安裝並使用一套 Hugging Face 視覺訓練技能，支援物件偵測、影像分類，以及 SAM/SAM2 分割等訓練工作。內容涵蓋資料集準備、雲端 GPU 環境設定、評估、Trackio 記錄與將結果推送到 Hub。很適合後端自動化與可重複的訓練流程。

後端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 透過 DataForSEO MCP server 將 Claude 連接到即時 SEO 資料，支援 SERP 檢查、關鍵字研究、反向連結、頁面內分析、競品研究、商家資訊，以及 AI 可見度追蹤。這個技能特別適合需要真實搜尋證據、清楚安裝指引與實用 seo-dataforseo 用法的資料導向工作流程。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一項用於在 Python 中建立、擬合、檢查與比較機率模型的 Bayesian 建模技能。可用 pymc 進行階層式迴歸、多層次分析、時間序列、缺失值、量測誤差，以及搭配 LOO 或 WAIC 的模型比較。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

geopandas 的 Python 地理空間向量資料分析技能，涵蓋 shapefiles、GeoJSON 與 GeoPackage 檔案。可用來讀取、清理、合併、建立緩衝區、裁切、重新投影與匯出空間資料，減少試錯。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

Analyzing-threat-intelligence-feeds 可協助你匯入 CTI feeds、標準化指標、評估 feed 品質，並為 STIX 2.1 工作流程強化 IOCs。這個 analyzing-threat-intelligence-feeds 技能專為威脅情資作業與資料分析而設，提供 TAXII、MISP 與商業 feeds 的實務指引。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是一個用於 Python 中 Azure AI Text Analytics 的技能。它可協助進行情感分析、實體辨識、關鍵片語擷取、語言偵測、PII 偵測與醫療保健 NLP。當你需要快速完成 Azure 用戶端設定、驗證，以及在應用程式、Notebook 或資料分析工作流程中實作實用的文字分析時，這個技能很適合。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一個 GitHub 技能，可在 Python 中直接執行 ClickHouse SQL，且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢，以及針對本機檔案與外部資料來源的後端開發工作流程。

後端开发

收藏 0GitHub 0