scanpy

作者 K-Dense-AI

用於 Python 中 scanpy 單細胞 RNA-seq 資料分析的技能。可用來進行 QC、正規化、PCA、UMAP/t-SNE、分群、標記基因探索、軌跡分析，以及產出適合發表的圖表。最適合以 AnnData 為核心、以探索性 scRNA-seq 工作流程為主的情境，並提供清楚的 scanpy 使用與安裝指引。

Stars0

評論0

加入時間2026年5月14日

分類数据分析

安裝指令

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

編輯評分

這個技能評分為 78/100，代表它很適合想直接套用現成 Scanpy 工作流程、而不是使用泛用提示詞的目錄使用者。此儲存庫展示了一個內容完整、非樣板化的單細胞 RNA-seq 技能，具體涵蓋實際應用情境、明確的工作流程步驟，以及足夠的結構，能幫助代理更少猜測地觸發並套用。

78/100

亮點

明確聚焦於標準 scRNA-seq 工作，例如 QC、正規化、PCA/UMAP/t-SNE、分群、標記基因與軌跡分析。
SKILL.md 內容相當充實，具備有效的 frontmatter、長篇正文、多個標題與範例程式碼，適合實務使用。
包含使用邊界與相關技能建議，協助代理在探索性單細胞分析時選用 Scanpy，並將深度學習或 AnnData 特定問題交由其他技能處理。

注意事項

未提供安裝指令、支援檔案或外部參考，因此導入主要仰賴書面技能說明。
此儲存庫看起來偏向文件型內容，使用者應預期的是工作流程指引，而非封裝好的自動化或已驗證腳本。

Scanpy Python 科学 Single Cell 生物信息学基因组学 Jupyter

總覽

scanpy 技能概覽

scanpy 是用來做什麼的

scanpy 技能是用於 Python 的單細胞 RNA-seq 分析：品質控制、正規化、特徵選擇、PCA、UMAP/t-SNE、分群、marker 發掘，以及 trajectory 風格的探索性分析。它最適合你已經有，或可以建立 AnnData 物件，並且想要一份實用的 scanpy Data Analysis 指南，而不是深度學習模型工作流程的人。

適合誰使用

如果你正在處理 scRNA-seq 資料、把原始計數轉成可分析的物件，或準備圖表與 cluster 註解以便解讀或發表，就適合使用 scanpy 技能。它很適合想走標準探索性流程、而且已經知道自己需要 scanpy 安裝與使用步驟的人，而不是需要一本通用生物資訊入門手冊的人。

它和其他技能有什麼不同

這個 repository 聚焦的是常見的 Scanpy 工作流程，而不是廣泛的理論總覽：資料載入、前處理、嵌入、分群與視覺化。它也把適用邊界講得更清楚——如果你需要深度生成模型，請看 scvi-tools；如果你的主要問題是 AnnData 結構或檔案格式，anndata 會是更好的起點。

如何使用 scanpy 技能

安裝並驗證這個技能

先依照一般的目錄工作流程安裝 scanpy 技能，然後在提問前先打開技能檔：

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

安裝完成後，先讀 scientific-skills/scanpy/SKILL.md，再往下看檔案內連結的各個段落。這裡沒有額外的 helper scripts 或 reference folders，所以技能文字本身就是主要依據。

提供可直接分析的輸入

scanpy 最有效的提問，會明確說出資料形狀、格式與目標。請包含你的輸入是 .h5ad、10X 輸出，還是 count matrix；你有多少 samples 或 batches；你需要的是 QC 閾值、整合、分群還是繪圖；以及你希望得到什麼輸出。較弱的提問會說「分析我的 scRNA-seq data」；較好的提問會說「使用 scanpy 載入兩組 10X datasets，過濾低品質細胞、做正規化、計算 PCA/UMAP、以多個解析度分群，並為每個 cluster 找出 marker genes」。

依照務實的工作流程來做

多數任務可以照這個順序處理：載入資料、檢查 obs/var、過濾低品質細胞與基因、正規化與 log 轉換、選取高變異基因、標準化並執行 PCA、建立 neighbors、計算 UMAP、分群，然後排名 marker 或視覺化基因集合。如果你已經有處理過的 AnnData，要直接說明；這樣可以避免技能重複講設定步驟，並讓輸出更聚焦在尚未完成的分析決策上。

先讀對的部分

先從 SKILL.md 開頭讀起，再跳到涵蓋設定、載入、前處理、繪圖與下游分析的使用章節。如果 repository 提到特定的輸入格式或慣例，請在提問中完全比照那些規範。目標是在模型開始寫 code 或分析步驟之前，先把猜測空間降到最低。

scanpy 技能 FAQ

scanpy 只適合 scRNA-seq 嗎？

是的，主要是。scanpy 技能的重心是單細胞轉錄體工作流程，尤其是基因表現矩陣的探索性分析。它不適合 bulk RNA-seq，也不適合那些更應交由專門單細胞深度學習工具處理的建模任務。

如果我已經會向模型提問，還需要這個技能嗎？

如果你已經清楚完整流程和精確物件，直接下 prompt 可能就夠了。當你想要一致的分析路徑、更少漏步，以及在 QC、前處理、分群和視覺化上有更好的預設值時，scanpy 技能就更有價值。

它對初學者友善嗎？

就「流程是標準化的」以及「技能專注於實用的 scanpy 使用」這一點來說，它算是對初學者友善。不過它仍然預設你理解基本 Python、單細胞概念，以及原始計數、正規化資料和標註 metadata 之間的差異。

什麼情況下不該用它？

如果你的問題主要是檔案轉換、AnnData schema 設計，或是要為 cell-state inference 建立神經網路模型，就不要把 scanpy 當主技能。這些情況下，換成其他技能或工具，通常會比硬要 scanpy 包辦整條流程得到更好的結果。

如何改進 scanpy 技能

提供會改變決策的輸入資訊

要明顯提升品質，關鍵是說清楚資料集大小、物種、平台、batch 結構，以及你目前走到分析的哪個階段。對 scanpy 使用來說，也請說明你是否有 ambient RNA 疑慮、是否需要 doublet filtering，或是否已有一組已知的 marker genes，因為這些細節會影響 QC 與解讀方式。

要求輸出成果，不只是步驟

不要只問「scanpy analysis」，而是指定具體交付物：一份 preprocessing notebook、分群工作流程、marker-gene table，或一段包含 UMAP 與 violin plots 的繪圖區塊。明確的輸出目標能幫模型選對 scanpy guide 結構，也能避免它過度解釋你不需要的基礎內容。

注意常見失敗模式

最常見的錯誤包括：跳過 QC 背景、混用 raw 與 normalized layers、還沒確認 neighbors 和 scaling 的選擇就先分群，以及沒有定義生物問題就要求結果。如果第一版太籠統，請改寫時把精確的輸入物件、變數名稱，以及你希望分析支援的決策講清楚。

一次只加一個限制條件

在第一版之後，要改進 scanpy 技能輸出，最好一次只加一個限制條件：例如「只用 h5ad」、「不要做 integration」、「做出可發表等級的圖」，或「在 obs 中保留 batch labels」。這通常比大幅改寫更有效，因為它能維持工作流程穩定，同時收緊對你這個 scanpy for Data Analysis 任務真正重要的部分。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

clickhouse-best-practices

作者 ClickHouse

clickhouse-best-practices 是一個用於資料庫工程的 ClickHouse 最佳實務技能。它以規則式建議引導 schema 設計、查詢調校、寫入策略與 agent 連線，讓 clickhouse-best-practices 在 ClickHouse 工作流程中的使用更容易被觸發、審查與引用。

資料庫工程

收藏 0GitHub 412

chdb-datastore

作者 ClickHouse

chdb-datastore 是一個相容 pandas 的技能，透過 ClickHouse 支援的 DataStore API 提供快速資料分析。它支援檔案、資料庫與雲端連接器、跨來源 JOIN，以及只需極少程式碼變更的 pandas 風格工作流程。當你需要一個可直接替換、用於較大資料集的分析層時，可以使用這份 chdb-datastore 指南。

数据分析

收藏 0GitHub 0

sympy

作者 K-Dense-AI

使用 sympy 技能在 Python 中進行精確的符號數學運算，涵蓋代數、微積分、矩陣、物理公式、數論、幾何與程式碼生成。它能幫助你維持表達式的精確性、選對 SymPy 模組，並避免過度依賴浮點數造成的錯誤。最適合需要實用 sympy 指南來處理符號工作流程，以及在 Data Analysis 中使用 sympy 的使用者。

数据分析

收藏 0GitHub 21.4k

interpreting-culture-index

作者 trailofbits

interpreting-culture-index 可協助解讀 Culture Index 問卷、個人檔案匯出內容，以及相關的招募或教練筆記。這個 interpreting-culture-index 技能適合用於職務適配、團隊動態、倦怠風險、候選人回饋簡報、入職規劃與衝突調解。它強調依箭頭相對位置來閱讀、檢查反模式，以及產出實用的分析結果，支援資料分析與決策判斷。

数据分析

收藏 0GitHub 5k

azure-search-documents-py

作者 microsoft

azure-search-documents-py 是 Python 版的 Azure AI Search 技能，適合後端開發，涵蓋安裝、驗證、索引設計、向量搜尋、混合搜尋、語意排序與 agentic retrieval。當你需要從環境設定一路到可運作的查詢模式的實作指引時，適合使用 azure-search-documents-py 技能。

後端开发

收藏 0GitHub 2.3k

gget

作者 K-Dense-AI

gget 是一個生物資訊技能，可透過 CLI 或 Python 快速、統一地存取 20+ 個基因組資料庫與分析工具。適合查詢基因資訊、BLAST 相關資料、AlphaFold 結構、表現量資料、疾病關聯，以及進行類 enrichment 分析。它很適合快速探索，以及 gget for Data Analysis 工作流程。

数据分析

收藏 0GitHub 0

torch-geometric

作者 K-Dense-AI

適用於 PyTorch Geometric 圖神經網路的 torch-geometric 技能指南。可用來取得 torch-geometric 安裝協助、torch-geometric 使用方式、圖分類、節點分類、連結預測、異質圖、自訂 MessagePassing 層，以及為 Machine Learning 工作流程擴展 GNN。

Machine Learning

收藏 0GitHub 21.4k

rdkit

作者 K-Dense-AI

rdkit 技能可協助你精準處理化學資訊工作流程：解析 SMILES、SDF、MOL、PDB 與 InChI；計算描述子；產生指紋；執行子結構搜尋；處理反應；以及建立 2D/3D 座標。這份 rdkit 指南適合進階控制、自訂清理，以及用 rdkit 進行 Data Analysis 工作流程。

数据分析

收藏 0GitHub 21.4k

huggingface-vision-trainer

作者 huggingface

huggingface-vision-trainer 可協助你安裝並使用一套 Hugging Face 視覺訓練技能，支援物件偵測、影像分類，以及 SAM/SAM2 分割等訓練工作。內容涵蓋資料集準備、雲端 GPU 環境設定、評估、Trackio 記錄與將結果推送到 Hub。很適合後端自動化與可重複的訓練流程。

後端开发

收藏 0GitHub 10.4k

seo-dataforseo

作者 AgriciDaniel

seo-dataforseo 透過 DataForSEO MCP server 將 Claude 連接到即時 SEO 資料，支援 SERP 檢查、關鍵字研究、反向連結、頁面內分析、競品研究、商家資訊，以及 AI 可見度追蹤。這個技能特別適合需要真實搜尋證據、清楚安裝指引與實用 seo-dataforseo 用法的資料導向工作流程。

关键词研究

收藏 0GitHub 6.2k

pymc

作者 K-Dense-AI

PyMC 是一項用於在 Python 中建立、擬合、檢查與比較機率模型的 Bayesian 建模技能。可用 pymc 進行階層式迴歸、多層次分析、時間序列、缺失值、量測誤差，以及搭配 LOO 或 WAIC 的模型比較。

数据分析

收藏 0GitHub 0

pymatgen

作者 K-Dense-AI

pymatgen 是一套用於晶體結構、相圖、電子結構與檔案轉換的 Python 材料科學工具組。這個 pymatgen 技能可協助處理包含 CIF、POSCAR、VASP 與 Materials Project 資料的科學工作流程。

Scientific

收藏 0GitHub 0

geopandas

作者 K-Dense-AI

geopandas 的 Python 地理空間向量資料分析技能，涵蓋 shapefiles、GeoJSON 與 GeoPackage 檔案。可用來讀取、清理、合併、建立緩衝區、裁切、重新投影與匯出空間資料，減少試錯。

数据分析

收藏 0GitHub 0

analyzing-threat-intelligence-feeds

作者 mukul975

Analyzing-threat-intelligence-feeds 可協助你匯入 CTI feeds、標準化指標、評估 feed 品質，並為 STIX 2.1 工作流程強化 IOCs。這個 analyzing-threat-intelligence-feeds 技能專為威脅情資作業與資料分析而設，提供 TAXII、MISP 與商業 feeds 的實務指引。

数据分析

收藏 0GitHub 0

azure-ai-textanalytics-py

作者 microsoft

azure-ai-textanalytics-py 是一個用於 Python 中 Azure AI Text Analytics 的技能。它可協助進行情感分析、實體辨識、關鍵片語擷取、語言偵測、PII 偵測與醫療保健 NLP。當你需要快速完成 Azure 用戶端設定、驗證，以及在應用程式、Notebook 或資料分析工作流程中實作實用的文字分析時，這個技能很適合。

数据分析

收藏 0GitHub 0

chdb-sql

作者 ClickHouse

chdb-sql 是一個 GitHub 技能，可在 Python 中直接執行 ClickHouse SQL，且不需要伺服器。內容涵蓋 chdb.query()、Session、DB-API 連線、像 file() 與 s3() 這類表格函式、參數化查詢，以及針對本機檔案與外部資料來源的後端開發工作流程。

後端开发

收藏 0GitHub 0