pydeseq2

bởi K-Dense-AI

pydeseq2 là một kỹ năng DESeq2 bằng Python cho phân tích biểu hiện gen khác biệt từ bulk RNA-seq. Dùng nó để so sánh các điều kiện, xây dựng mô hình một nhân tố hoặc nhiều nhân tố, áp dụng kiểm định Wald và hiệu chỉnh FDR, đồng thời tạo biểu đồ volcano hoặc MA trong các quy trình làm việc với pandas và AnnData.

Stars0

Yêu thích0

Bình luận0

Đã thêm14 thg 5, 2026

Danh mụcData Analysis

Lệnh cài đặt

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Điểm tuyển chọn

Kỹ năng này đạt 80/100 và rất đáng để liệt kê. Kho lưu trữ cho người dùng danh mục đủ bằng chứng để một agent nhận ra khi nào nên dùng, đi theo quy trình xử lý biểu hiện gen khác biệt kiểu PyDESeq2 thực thụ, và áp dụng nó với ít phỏng đoán hơn so với một prompt chung chung. Dù chưa được đóng gói hoàn hảo, nội dung vận hành khá đầy đủ và có giá trị triển khai rõ ràng cho người dùng phân tích bulk RNA-seq.

80/100

Điểm mạnh

Khả năng kích hoạt tốt: phần frontmatter và mục "When to Use This Skill" nêu rõ DESeq2, differential expression, số đếm bulk RNA-seq, cùng các đề cập đến PyDESeq2.
Nội dung quy trình thực thi rõ ràng: phần thân kỹ năng có quick-start cụ thể với pandas, DeseqDataSet, DeseqStats, lọc dữ liệu, kiểm định Wald và hiệu chỉnh FDR.
Tạo đòn bẩy tốt cho agent: bao phủ thiết kế một nhân tố và nhiều nhân tố, xử lý batch/covariate, shrinkage apeGLM, và tích hợp với pandas/AnnData.

Điểm cần lưu ý

Không có lệnh cài đặt hay tệp hỗ trợ, nên người dùng có thể phải tự suy ra chi tiết môi trường/cấu hình.
Kho lưu trữ được gắn tín hiệu experimental/test và có vẻ chỉ là một tệp SKILL.md duy nhất, không có tài liệu tham khảo hay tài sản phụ trợ.

Python Pandas Bioinformatics Genomics Dataset

Tổng quan

Tổng quan về skill pydeseq2

pydeseq2 dùng để làm gì

pydeseq2 là một skill Python để phân tích biểu hiện gen khác biệt trên dữ liệu đếm bulk RNA-seq. Nó giúp bạn đi từ số đếm thô và metadata mẫu đến kết quả DE, fold change, p-value đã hiệu chỉnh, cùng các đầu ra khám phá quen thuộc như biểu đồ volcano và MA.

Ai nên dùng

Hãy dùng skill pydeseq2 nếu bạn muốn phân tích kiểu DESeq2 trong Python, cần thiết kế đa yếu tố, hoặc muốn đưa differential expression vào một workflow dựa trên pandas/AnnData. Đây là lựa chọn phù hợp cho người đã có ma trận count và metadata lâm sàng hoặc thí nghiệm, không phải cho người đang tìm một pipeline xử lý RNA-seq hoàn chỉnh từ đầu đến cuối.

Điểm hữu ích của pydeseq2

Giá trị chính của pydeseq2 là giảm ma sát khi chuyển ngữ cảnh cho người dùng Python vốn thường phải nhảy sang R để dùng DESeq2. Nó hỗ trợ kiểm định Wald, hiệu chỉnh đa kiểm định, tùy chọn shrinkage bằng apeGLM, và một workflow đủ thực tế để dùng lặp lại trong notebook hoặc pipeline.

Cách dùng skill pydeseq2

Cài đặt pydeseq2

Cài skill này vào bộ Claude skills của bạn, rồi mở các file của skill trước khi prompt:
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Khi quyết định cài đặt và thiết lập pydeseq2, hãy xác nhận môi trường của bạn đã có bảng count RNA-seq, metadata mẫu, và các gói Python mà workflow cần. Skill này phát huy tốt nhất khi bạn có số đếm theo mẫu và gene cùng với công thức thiết kế hoặc biến nhóm.

Bắt đầu từ input đúng

Cách dùng pydeseq2 hiệu quả luôn bắt đầu bằng cấu trúc đầu vào sạch:

một ma trận count với mẫu là hàng và gene là cột
metadata được index theo sample ID
một cột điều kiện rõ ràng, và bất kỳ cột batch hay covariate nào bạn muốn đưa vào mô hình
một mục tiêu so sánh cụ thể, chẳng hạn treated vs control

Một prompt yếu sẽ nói: “Run differential expression on my RNA-seq data.”
Một prompt tốt hơn sẽ nói: “Use pydeseq2 on a bulk RNA-seq count matrix with 24 samples, compare treated vs control, include batch as a covariate, filter very low-count genes, and return significant genes plus volcano/MA plot code.”

Đọc các file này trước

Bắt đầu với SKILL.md để nắm workflow và các bước phân tích dự kiến. Sau đó xem README.md, AGENTS.md, metadata.json, và bất kỳ thư mục rules/, resources/, references/, hoặc scripts/ nào nếu có. Với repository này, tín hiệu thực hành chính nằm trong SKILL.md, nên đừng mặc định rằng sẽ có thêm các file trợ giúp khác.

Dùng pydeseq2 cho đúng

Hãy coi pydeseq2 là một phương pháp phân tích, không chỉ là công cụ sinh code. Hãy nói rõ với model:

bạn đang có sinh vật và loại assay nào
mẫu được phân nhóm ra sao
bạn cần mô hình một yếu tố hay đa yếu tố
bạn có muốn shrinkage, ranking, hay trực quan hóa không
bạn cần đầu ra ở định dạng nào, như dataframe, các cell notebook, hay một script có thể tái sử dụng

Điều này giúp cải thiện việc dùng pydeseq2 vì model có thể chọn đúng thiết kế, cách lọc, và các bước diễn giải thay vì đoán mò.

Câu hỏi thường gặp về skill pydeseq2

pydeseq2 chỉ dành cho người dùng DESeq2 thôi à?

Không. Nó dành cho bất kỳ ai muốn phân tích biểu hiện gen khác biệt kiểu DESeq2 trong Python. Nó đặc biệt hữu ích nếu bạn đã làm việc trong pandas, scanpy, hoặc AnnData và muốn giữ phân tích trong một hệ sinh thái duy nhất.

Tôi có cần prompt thật hoàn hảo để dùng không?

Không, nhưng prompt mơ hồ sẽ dẫn đến code phân tích chung chung. Skill pydeseq2 hoạt động tốt nhất khi bạn cung cấp kích thước bảng count, phép so sánh quan tâm, và bất kỳ yếu tố gây nhiễu nào đã biết.

pydeseq2 có thân thiện với người mới không?

Nó thân thiện với người mới nếu bạn đã hiểu những nguyên tắc cơ bản về count RNA-seq và thiết kế thí nghiệm. Nó kém phù hợp hơn nếu bạn cần hỗ trợ về alignment, quantification, hoặc QC đầu vào trước khi làm differential expression.

Khi nào thì không nên dùng pydeseq2?

Đừng dùng nó cho differential expression của single-cell, dữ liệu biểu hiện đã chuẩn hóa nhưng không có raw counts, hoặc các workflow cần một pipeline transcriptomics hoàn chỉnh từ đầu đến cuối. Nó cũng không phải lựa chọn đúng nếu nhu cầu thực sự của bạn là diễn giải thống kê mà không có dữ liệu count ở cấp gene.

Cách cải thiện skill pydeseq2

Cung cấp ngữ cảnh sinh học tốt hơn

Kết quả pydeseq2 tốt nhất đến từ các prompt mô tả thiết kế nghiên cứu, chứ không chỉ tên file. Hãy nêu biến đáp ứng, điều kiện đối chứng, hiệu ứng batch, số lượng mẫu lặp, và bạn muốn ranking gene, code vẽ biểu đồ, hay phần diễn giải.

Chỉ rõ các quyết định phân tích bạn quan tâm

Hãy nói với skill cách xử lý gene ít count, có cần mô hình đa yếu tố hay không, và có cần shrinkage cho effect size hay không. Những lựa chọn này ảnh hưởng trực tiếp đến đầu ra pydeseq2 và giúp tránh các mặc định chung chung có thể không khớp với nghiên cứu của bạn.

Yêu cầu đầu ra có thể tái sử dụng

Thay vì chỉ hỏi “kết quả”, hãy yêu cầu schema dataframe đã lưu, một đoạn code vẽ biểu đồ, hoặc một workflow sẵn dùng trong notebook. Ví dụ: “Return pydeseq2 code that fits the model, extracts adjusted p-values, and writes a CSV of significant genes with log2 fold change and padj.”

Lặp lại từ chẩn đoán, không chỉ từ các hit cuối cùng

Nếu lần chạy đầu tiên trông không ổn, hãy yêu cầu các kiểm tra thiên về QC: clustering mẫu, lý do lọc count, số gene được giữ lại, hoặc công thức thiết kế có bị confound hay không. Đây là cách nhanh nhất để cải thiện pydeseq2 cho Data Analysis khi kết quả yếu hoặc thưa bất thường.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

clickhouse-best-practices

bởi ClickHouse

clickhouse-best-practices là skill best practices cho ClickHouse dành cho Database Engineering. Skill này hướng dẫn thiết kế schema, tối ưu truy vấn, chiến lược insert và kết nối agent bằng các khuyến nghị theo quy tắc, giúp việc kích hoạt, rà soát và trích dẫn cách dùng clickhouse-best-practices trong các workflow ClickHouse trở nên dễ dàng hơn.

Database Engineering

Yêu thích 0GitHub 412

chdb-datastore

bởi ClickHouse

chdb-datastore là một kỹ năng tương thích với pandas, phục vụ phân tích dữ liệu nhanh với DataStore API dựa trên ClickHouse. Kỹ năng này hỗ trợ kết nối file, cơ sở dữ liệu và cloud, join giữa nhiều nguồn dữ liệu, cùng các thay đổi mã tối thiểu cho workflow kiểu pandas. Hãy dùng hướng dẫn chdb-datastore này khi bạn cần một lớp phân tích cắm vào là chạy cho các tập dữ liệu lớn hơn.

Data Analysis

Yêu thích 0GitHub 0

sympy

bởi K-Dense-AI

Dùng sympy để làm toán học ký hiệu chính xác trong Python, bao gồm đại số, giải tích, ma trận, công thức vật lý, lý thuyết số, hình học và sinh mã. Skill này giúp bạn giữ biểu thức ở dạng chính xác, chọn đúng module của SymPy và tránh các lỗi thường gặp khi phụ thuộc quá nhiều vào số thực. Phù hợp nhất cho người cần một hướng dẫn sympy thực dụng cho quy trình làm việc ký hiệu và sympy cho phân tích dữ liệu.

Data Analysis

Yêu thích 0GitHub 21.4k

interpreting-culture-index

bởi trailofbits

interpreting-culture-index giúp diễn giải các khảo sát Culture Index, bản xuất hồ sơ và các ghi chú liên quan đến tuyển dụng hoặc coaching. Hãy dùng skill interpreting-culture-index này cho đánh giá độ phù hợp vai trò, động lực đội nhóm, nguy cơ kiệt sức, tóm tắt trao đổi ứng viên, kế hoạch onboarding và hòa giải xung đột. Skill này nhấn mạnh cách đọc tương đối theo mũi tên, kiểm tra anti-pattern và đầu ra thực tiễn cho phân tích dữ liệu cùng hỗ trợ ra quyết định.

Data Analysis

Yêu thích 0GitHub 5k

azure-search-documents-py

bởi microsoft

azure-search-documents-py là skill Python cho Azure AI Search, dành cho phát triển backend, bao gồm cài đặt, xác thực, thiết kế index, tìm kiếm vector, tìm kiếm hybrid, xếp hạng semantic và truy xuất theo tác tử. Hãy dùng azure-search-documents-py khi bạn cần hướng dẫn thực tế từ khâu thiết lập đến các mẫu truy vấn hoạt động được.

Backend Development

Yêu thích 0GitHub 2.3k

gget

bởi K-Dense-AI

gget là một skill tin sinh học giúp truy cập nhanh, thống nhất hơn 20 cơ sở dữ liệu hệ gen và công cụ phân tích từ CLI hoặc Python. Dùng nó để tra cứu thông tin gen, truy vấn liên quan đến BLAST, cấu trúc AlphaFold, dữ liệu biểu hiện, liên kết bệnh lý và các phân tích kiểu enrichment. Nó phù hợp cho việc khám phá nhanh và các quy trình phân tích dữ liệu với gget.

Data Analysis

Yêu thích 0GitHub 0

torch-geometric

bởi K-Dense-AI

Hướng dẫn skill torch-geometric cho mạng nơ-ron đồ thị PyTorch Geometric. Dùng để được hỗ trợ cài đặt torch-geometric, cách sử dụng torch-geometric, phân loại đồ thị, phân loại nút, dự đoán liên kết, đồ thị dị thể, các lớp MessagePassing tùy chỉnh và mở rộng GNN cho quy trình Machine Learning.

Machine Learning

Yêu thích 0GitHub 21.4k

rdkit

bởi K-Dense-AI

Kỹ năng rdkit hỗ trợ các quy trình cheminformatics chính xác: phân tích cú pháp SMILES, SDF, MOL, PDB và InChI; tính toán descriptor; tạo fingerprint; chạy tìm kiếm substructure; xử lý phản ứng; và xây dựng tọa độ 2D/3D. Hãy dùng hướng dẫn rdkit này khi cần kiểm soát nâng cao, sanitization tùy chỉnh, và quy trình rdkit cho phân tích dữ liệu.

Data Analysis

Yêu thích 0GitHub 21.4k

huggingface-vision-trainer

bởi huggingface

huggingface-vision-trainer giúp bạn cài đặt và sử dụng một skill Hugging Face cho các tác vụ huấn luyện thị giác máy tính: phát hiện đối tượng, phân loại ảnh và phân đoạn SAM/SAM2. Nội dung bao gồm chuẩn bị dữ liệu, thiết lập GPU trên cloud, đánh giá mô hình, ghi log bằng Trackio và đẩy kết quả lên Hub. Phù hợp cho tự động hóa backend và các quy trình huấn luyện có thể lặp lại.

Backend Development

Yêu thích 0GitHub 10.4k

seo-dataforseo

bởi AgriciDaniel

seo-dataforseo kết nối Claude với dữ liệu SEO trực tiếp qua DataForSEO MCP server để kiểm tra SERP, nghiên cứu từ khóa, backlink, phân tích on-page, nghiên cứu đối thủ, danh sách doanh nghiệp và theo dõi mức độ hiển thị trong AI. Đây là lựa chọn phù hợp nhất cho các quy trình dựa trên dữ liệu khi bạn cần bằng chứng tìm kiếm thực tế, hướng dẫn cài đặt rõ ràng và cách dùng seo-dataforseo thực tiễn.

Keyword Research

Yêu thích 0GitHub 6.2k

pymc

bởi K-Dense-AI

PyMC là một skill mô hình hóa Bayes để xây dựng, fit, kiểm tra và so sánh các mô hình xác suất trong Python. Dùng pymc cho hồi quy phân cấp, phân tích đa mức, chuỗi thời gian, dữ liệu thiếu, sai số đo lường và so sánh mô hình với LOO hoặc WAIC.

Data Analysis

Yêu thích 0GitHub 0

pymatgen

bởi K-Dense-AI

pymatgen là một toolkit khoa học vật liệu bằng Python cho cấu trúc tinh thể, giản đồ pha, cấu trúc điện tử và chuyển đổi tệp. Skill pymatgen này hỗ trợ các quy trình làm việc khoa học với CIF, POSCAR, VASP và dữ liệu Materials Project.

Scientific

Yêu thích 0GitHub 0

geopandas

bởi K-Dense-AI

Skill geopandas dành cho phân tích dữ liệu vector địa lý bằng Python, bao gồm shapefile, GeoJSON và GeoPackage. Dùng để đọc, làm sạch, nối, tạo vùng đệm, cắt, chuyển hệ tọa độ và xuất dữ liệu không gian với ít phải đoán mò hơn.

Data Analysis

Yêu thích 0GitHub 0

analyzing-threat-intelligence-feeds

bởi mukul975

Analyzing-threat-intelligence-feeds giúp bạn nạp các CTI feeds, chuẩn hóa chỉ báo, đánh giá chất lượng feed và làm giàu IOC cho quy trình STIX 2.1. Skill analyzing-threat-intelligence-feeds này được xây dựng cho nghiệp vụ threat intel và Data Analysis, với hướng dẫn thực hành cho TAXII, MISP và các feed thương mại.

Data Analysis

Yêu thích 0GitHub 0

azure-ai-textanalytics-py

bởi microsoft

azure-ai-textanalytics-py là một skill cho Azure AI Text Analytics trong Python. Skill này hỗ trợ phân tích cảm xúc, nhận diện thực thể, trích xuất cụm từ khóa, phát hiện ngôn ngữ, phát hiện PII và NLP cho y tế. Hãy dùng khi bạn cần đi nhanh từ khâu thiết lập client Azure, xác thực đến cách dùng text analytics thực tế cho ứng dụng, notebook hoặc quy trình phân tích dữ liệu.

Data Analysis

Yêu thích 0GitHub 0

chdb-sql

bởi ClickHouse

chdb-sql là một GitHub skill để chạy ClickHouse SQL trong Python mà không cần server. Skill này bao gồm `chdb.query()`, `Session`, kết nối DB-API, các table function như `file()` và `s3()`, truy vấn tham số, và quy trình phát triển backend với tệp cục bộ cùng nguồn dữ liệu bên ngoài.

Backend Development

Yêu thích 0GitHub 0