pydeseq2

por K-Dense-AI

pydeseq2 es una skill de Python basada en DESeq2 para el análisis diferencial de expresión génica en RNA-seq a gran escala. Úsala para comparar condiciones, ajustar diseños de uno o varios factores, aplicar pruebas de Wald y corrección FDR, y generar gráficos volcano o MA en flujos de trabajo con pandas y AnnData.

Estrellas0

Favoritos0

Comentarios0

Agregado14 may 2026

CategoríaData Analysis

Comando de instalación

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Puntuación editorial

Esta skill obtiene 80/100 y merece figurar en el directorio. El repositorio ofrece suficientes señales para que un agente identifique cuándo usarla, siga un flujo real de expresión diferencial con PyDESeq2 y la aplique con menos improvisación que con un prompt genérico. No está empaquetada a la perfección, pero sí aporta contenido operativo sólido y un valor claro de instalación para quienes trabajan con análisis de RNA-seq a gran escala.

80/100

Puntos fuertes

Alta capacidad de activación: el frontmatter y "When to Use This Skill" apuntan de forma explícita a DESeq2, expresión diferencial, conteos de RNA-seq a gran escala y menciones de PyDESeq2.
Contenido de flujo de trabajo operativo: el cuerpo de la skill incluye un quick-start concreto con pandas, DeseqDataSet, DeseqStats, filtrado, pruebas de Wald y corrección FDR.
Buen apoyo para agentes: cubre diseños de un solo factor y de varios factores, manejo de batch/covariables, shrinkage con apeGLM e integración con pandas/AnnData.

Puntos a tener en cuenta

No se proporciona comando de instalación ni archivos de soporte, así que los usuarios quizá deban inferir por su cuenta los detalles del entorno y la configuración.
El repositorio aparece marcado con una señal experimental/de prueba y parece ser un único SKILL.md sin referencias ni recursos auxiliares.

Python Pandas Bioinformatics Genomics Dataset

Resumen

Panorama general de pydeseq2

Para qué sirve pydeseq2

pydeseq2 es una skill de Python para hacer análisis de expresión génica diferencial con datos de conteos de RNA-seq bulk. Te ayuda a pasar de conteos brutos y metadatos de muestra a resultados de DE, cambios de pliegue, valores p ajustados y salidas exploratorias habituales como gráficos volcano y MA.

Quién debería usarlo

Usa la skill pydeseq2 si quieres un análisis estilo DESeq2 en Python, necesitas diseños multifactoriales o quieres integrar la expresión diferencial en un flujo de trabajo basado en pandas/AnnData. Encaja bien para analistas que ya tienen matrices de conteos y metadatos clínicos o experimentales, no para quien busca un pipeline completo de preprocesamiento de RNA-seq.

Qué lo hace útil

El valor principal de pydeseq2 es que reduce la fricción de traducción para usuarios de Python que, de otro modo, tendrían que saltar a R para usar DESeq2. Soporta pruebas de Wald, corrección por comparaciones múltiples, shrinkage opcional con apeGLM y un flujo de trabajo práctico para uso reproducible en notebooks o pipelines.

Cómo usar la skill pydeseq2

Instala pydeseq2

Instala la skill en tu conjunto de skills de Claude y, antes de pedir nada, abre los archivos de la skill:
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Para decidir la instalación y la configuración de pydeseq2, verifica que tu entorno ya tenga la tabla de conteos de RNA-seq, los metadatos de muestra y los paquetes de Python que necesita tu flujo de trabajo. La skill resulta especialmente útil cuando puedes proporcionar conteos por muestra y por gen, junto con una fórmula de diseño o una variable de agrupación.

Empieza con las entradas correctas

Un buen uso de pydeseq2 empieza con una estructura de entrada limpia:

una matriz de conteos con las muestras como filas y los genes como columnas
metadatos indexados por ID de muestra
una columna de condición clara y cualquier columna de lote o covariable que quieras incluir en el modelo
un objetivo de comparación explícito, como tratado frente a control

Un prompt débil dice: “Haz análisis de expresión diferencial con mis datos de RNA-seq.”
Un prompt más sólido dice: “Usa pydeseq2 sobre una matriz de conteos bulk de RNA-seq con 24 muestras, compara tratado frente a control, incluye batch como covariable, filtra genes con muy pocos conteos y devuelve los genes significativos junto con código para gráficos volcano y MA.”

Lee primero estos archivos

Empieza por SKILL.md para ver el flujo de trabajo y los pasos de análisis esperados. Después revisa README.md, AGENTS.md, metadata.json y cualquier carpeta rules/, resources/, references/ o scripts/ si existe. En este repositorio, la señal práctica principal está en SKILL.md, así que no des por hecho que hay archivos auxiliares adicionales.

Usa pydeseq2 bien

Trata pydeseq2 como un método de análisis, no solo como un generador de código. Dile al modelo:

qué organismo y qué ensayo tienes
cómo están agrupadas las muestras
si necesitas un diseño de un solo factor o multifactorial
si quieres shrinkage, ordenación o visualización
qué formato de salida necesitas, por ejemplo un dataframe, celdas de notebook o un script reutilizable

Esto mejora el uso de pydeseq2 porque el modelo puede elegir el diseño, el filtrado y los pasos de interpretación adecuados en lugar de adivinar.

Preguntas frecuentes sobre la skill pydeseq2

¿pydeseq2 es solo para usuarios de DESeq2?

No. Es para cualquiera que quiera un análisis de expresión diferencial parecido a DESeq2 en Python. Es especialmente útil si ya trabajas con pandas, scanpy o AnnData y quieres mantener el análisis en un solo stack.

¿Necesito un prompt perfecto para usarlo?

No, pero los prompts vagos llevan a código de análisis genérico. La skill pydeseq2 funciona mejor cuando indicas la forma de la tabla de conteos, la comparación de interés y cualquier confusor conocido.

¿pydeseq2 es apto para principiantes?

Es apto para principiantes si ya entiendes lo básico de los conteos de RNA-seq y del diseño experimental. Es menos adecuado si necesitas ayuda con alineamiento, cuantificación o control de calidad previo a la expresión diferencial.

¿Cuándo no debería usar pydeseq2?

No lo uses para expresión diferencial de single-cell, para expresión normalizada sin conteos brutos o para flujos de trabajo que necesiten un pipeline completo de transcriptómica de extremo a extremo. Tampoco es la mejor opción si lo que realmente necesitas es interpretación estadística sin datos de conteo a nivel de gen.

Cómo mejorar la skill pydeseq2

Aporta más contexto biológico

Los mejores resultados con pydeseq2 salen de prompts que explican el diseño del estudio, no solo los nombres de archivo. Incluye la variable de respuesta, la condición control, los efectos de lote, el número de réplicas y si quieres ordenación de genes, código para gráficos o interpretación.

Especifica las decisiones analíticas que te importan

Dile a la skill cómo tratar los genes con pocos conteos, si debe usar un modelo multifactorial y si necesitas shrinkage para los tamaños de efecto. Estas decisiones afectan de forma material las salidas de pydeseq2 y ayudan a evitar valores por defecto genéricos que pueden no encajar con tu estudio.

Pide una salida que puedas reutilizar

En lugar de pedir solo “resultados”, solicita un esquema de dataframe guardado, un fragmento para gráficos o un flujo de trabajo listo para notebook. Por ejemplo: “Devuelve código de pydeseq2 que ajuste el modelo, extraiga los valores p ajustados y escriba un CSV de genes significativos con log2 fold change y padj.”

Itera a partir de diagnósticos, no solo de los hits finales

Si la primera ejecución no parece correcta, pide comprobaciones orientadas a QC: agrupamiento de muestras, justificación del filtrado de conteos, número de genes retenidos o si la fórmula del diseño está confundida. Esta es la forma más rápida de mejorar pydeseq2 para análisis de datos cuando los resultados son débiles o inesperadamente escasos.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

chdb-datastore es una skill compatible con pandas para realizar análisis de datos rápidos con una DataStore API respaldada por ClickHouse. Admite conectores de archivos, bases de datos y nube, joins entre distintas fuentes y cambios mínimos de código en flujos de trabajo al estilo pandas. Usa esta guía de chdb-datastore cuando busques una capa de análisis lista para usar sobre conjuntos de datos grandes.

Data Analysis

Favoritos 0GitHub 0

sympy

por K-Dense-AI

Usa la skill sympy para matemáticas simbólicas exactas en Python, incluyendo álgebra, cálculo, matrices, fórmulas de física, teoría de números, geometría y generación de código. Te ayuda a mantener las expresiones exactas, elegir los módulos adecuados de SymPy y evitar errores típicos por depender demasiado de floats. Es ideal para quienes necesitan una guía práctica de sympy para flujos de trabajo simbólicos y sympy para análisis de datos.

Data Analysis

Favoritos 0GitHub 21.4k

interpreting-culture-index

por trailofbits

interpreting-culture-index ayuda a interpretar encuestas de Culture Index, exportaciones de perfiles y notas relacionadas con contratación o coaching. Usa esta skill interpreting-culture-index para evaluar ajuste al rol, dinámica de equipo, riesgo de burnout, sesiones de feedback de candidatos, planes de onboarding y mediación de conflictos. Hace énfasis en la lectura relativa de flechas, la detección de anti-patrones y resultados prácticos para análisis de datos y apoyo a decisiones.

Data Analysis

Favoritos 0GitHub 5k

azure-search-documents-py

por microsoft

azure-search-documents-py es la skill de Azure AI Search en Python para desarrollo backend, y cubre instalación, autenticación, diseño de índices, búsqueda vectorial, búsqueda híbrida, ranking semántico y recuperación agentic. Usa la skill azure-search-documents-py cuando necesites orientación práctica, desde la configuración inicial hasta patrones de consulta funcionales.

Backend Development

Favoritos 0GitHub 2.3k

gget

por K-Dense-AI

gget es una skill de bioinformática para acceder de forma rápida y unificada a más de 20 bases de datos genómicas y herramientas de análisis desde CLI o Python. Úsala para información de genes, búsquedas relacionadas con BLAST, estructuras de AlphaFold, datos de expresión, asociaciones con enfermedades y análisis de enriquecimiento. Encaja bien para exploración rápida y flujos de trabajo de análisis de datos con gget.

Data Analysis

Favoritos 0GitHub 0

torch-geometric

por K-Dense-AI

Guía de torch-geometric para redes neuronales gráficas con PyTorch Geometric. Úsala para ayuda de instalación de torch-geometric, uso de torch-geometric, clasificación de grafos, clasificación de nodos, predicción de enlaces, grafos heterogéneos, capas `MessagePassing` personalizadas y escalado de GNN en flujos de trabajo de Machine Learning.

Machine Learning

Favoritos 0GitHub 21.4k

rdkit

por K-Dense-AI

La skill de rdkit ayuda a trabajar con flujos de quimioinformática de alta precisión: analizar SMILES, SDF, MOL, PDB e InChI; calcular descriptores; generar fingerprints; ejecutar búsquedas de subestructuras; manejar reacciones; y crear coordenadas 2D/3D. Usa esta guía de rdkit para control avanzado, sanitización personalizada y flujos de rdkit para análisis de datos.

Data Analysis

Favoritos 0GitHub 21.4k

huggingface-vision-trainer

por huggingface

huggingface-vision-trainer te ayuda a instalar y usar una skill de Hugging Face para trabajos de entrenamiento de visión: detección de objetos, clasificación de imágenes y segmentación con SAM/SAM2. Cubre preparación de datasets, configuración de GPU en la nube, evaluación, registro con Trackio y publicación de resultados en el Hub. Es ideal para automatización en backend y flujos de entrenamiento repetibles.

Backend Development

Favoritos 0GitHub 10.4k

seo-dataforseo

por AgriciDaniel

seo-dataforseo conecta Claude con datos SEO en vivo a través del servidor MCP de DataForSEO para comprobar SERP, investigar palabras clave, analizar backlinks y on-page, estudiar la competencia, revisar fichas de negocio y seguir la visibilidad en IA. Es ideal para flujos de trabajo basados en datos cuando necesitas evidencia real de búsqueda, una guía de instalación clara y un uso práctico de seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

pymc

por K-Dense-AI

PyMC es un skill de modelado bayesiano para construir, ajustar, comprobar y comparar modelos probabilísticos en Python. Usa pymc para regresión jerárquica, análisis multivel, series temporales, datos faltantes, error de medición y comparación de modelos con LOO o WAIC.

Data Analysis

Favoritos 0GitHub 0

pymatgen

por K-Dense-AI

pymatgen es un kit de herramientas de ciencia de materiales en Python para estructuras cristalinas, diagramas de fases, estructura electrónica y conversión de archivos. Esta skill de pymatgen ayuda en flujos de trabajo científicos con CIF, POSCAR, VASP y datos de Materials Project.

Scientific

Favoritos 0GitHub 0

geopandas

por K-Dense-AI

Skill de geopandas para análisis de datos vectoriales geoespaciales en Python, incluyendo shapefiles, GeoJSON y archivos GeoPackage. Úsalo para leer, limpiar, unir, generar buffers, recortar, reproyectar y exportar datos espaciales con menos margen de error.

Data Analysis

Favoritos 0GitHub 0

analyzing-threat-intelligence-feeds

por mukul975

analyzing-threat-intelligence-feeds te ayuda a ingerir feeds de CTI, normalizar indicadores, evaluar la calidad de los feeds y enriquecer IOCs para flujos de trabajo STIX 2.1. Esta skill de analyzing-threat-intelligence-feeds está pensada para operaciones de inteligencia de amenazas y análisis de datos, con orientación práctica para TAXII, MISP y feeds comerciales.

Data Analysis

Favoritos 0GitHub 0

azure-ai-textanalytics-py

por microsoft

azure-ai-textanalytics-py es una skill para Azure AI Text Analytics en Python. Sirve para análisis de sentimiento, reconocimiento de entidades, extracción de frases clave, detección de idioma, detección de PII y NLP para salud. Úsala cuando necesites una vía rápida para configurar clientes de Azure, autenticación y uso práctico de análisis de texto en apps, notebooks o flujos de análisis de datos.

Data Analysis

Favoritos 0GitHub 0

chdb-sql

por ClickHouse

chdb-sql es una skill de GitHub para ejecutar SQL de ClickHouse en Python sin un servidor. Cubre `chdb.query()`, `Session`, conexiones DB-API, funciones de tabla como `file()` y `s3()`, consultas parametrizadas y flujos de trabajo de desarrollo backend con archivos locales y fuentes de datos externas.

Backend Development

Favoritos 0GitHub 0