pytdc

por K-Dense-AI

pytdc es una skill para Therapeutics Data Commons, que ofrece conjuntos de datos y benchmarks listos para IA para descubrimiento de fármacos en ADME, toxicidad, DTI, DDI, generación, divisiones scaffold y predicción farmacológica.

Estrellas0

Favoritos0

Comentarios0

Agregado14 may 2026

CategoríaData Analysis

Comando de instalación

npx skills add K-Dense-AI/claude-scientific-skills --skill pytdc

Puntuación editorial

Esta skill obtiene 78/100, lo que la convierte en una opción sólida para el directorio si necesitas un flujo de trabajo práctico de PyTDC para ML en terapias. El repositorio aporta suficiente detalle operativo para ayudar a un agente a reconocer cuándo usarlo, instalarlo y trabajar con tareas clave de datos y benchmarks con menos incertidumbre que con un prompt genérico.

78/100

Puntos fuertes

Los casos de uso explícitos abarcan ADME, toxicidad, interacción fármaco-diana, generación de moléculas y evaluación de benchmarks.
Se incluyen comandos de instalación y actualización con una ruta concreta con pip/uv, lo que mejora su detectabilidad y adopción.
Un SKILL.md largo y estructurado, con muchos encabezados y secciones de flujo de trabajo, sugiere una guía operativa sustancial y no un simple marcador de posición.

Puntos a tener en cuenta

El árbol del repositorio no muestra scripts, referencias, recursos ni metadatos de comandos de instalación más allá de SKILL.md, así que algunos flujos pueden depender solo de instrucciones narrativas.
El extracto indica una cobertura amplia, pero aquí no se ve un quick start completo de extremo a extremo, por lo que para tareas específicas aún puede hacer falta algo de prueba y error.

Python Dataset Benchmarking Machine Learning Drug Discovery Therapeutic

Resumen

Resumen de la skill `pytdc`

Para qué sirve `pytdc`

pytdc es la skill para usar Therapeutics Data Commons en flujos de trabajo de descubrimiento de fármacos impulsados por IA. Te ayuda a acceder a datasets y benchmarks curados y listos para IA para tareas de ADME, toxicidad, bioactividad, interacción fármaco-diana, interacción fármaco-fármaco, generación y otras tareas de evaluación relacionadas, sin tener que inventar tu propio esquema de datos.

Quién debería instalarla

Instala la skill pytdc si trabajas en ML terapéutico, predicción farmacológica o evaluación comparativa de modelos con particiones y métricas estandarizadas. Encaja muy bien para científicos de datos que necesitan acceso reproducible a datasets; encaja peor si solo necesitas un prompt genérico de química, sin carga de datos ni paso de evaluación.

Por qué importa

El valor principal de la skill pytdc no es solo el acceso a datasets, sino la estructura que lo rodea: cargadores específicos por tarea, particiones estándar como scaffold o cold splits, y opciones de evaluación pensadas para benchmarking. Eso reduce los bloqueos habituales de adopción en el trabajo de descubrimiento de fármacos, donde el preprocesamiento inconsistente y las divisiones hechas a medida pueden hacer que los resultados sean difíciles de confiar.

Cómo usar la skill `pytdc`

Instala `pytdc` en tu entorno

Usa primero el comando de instalación de las instrucciones de la skill:
uv pip install PyTDC

Para actualizar una instalación existente, usa:
uv pip install PyTDC --upgrade

Si tu flujo de trabajo usa otro gestor de paquetes, aplica el mismo nombre de paquete en ese entorno en lugar de reescribir los supuestos de la skill.

Empieza por los archivos correctos

Empieza con SKILL.md y después lee las secciones de resumen, cuándo usarlo, instalación y quick start antes de saltar al código. Si necesitas más contexto del proyecto, revisa cualquier documentación cercana que el repo exponga a través del árbol de archivos de la skill; en este repositorio, el contenido de la skill es la principal fuente de verdad.

Convierte un objetivo vago en un prompt útil

pytdc usage funciona mejor cuando tu prompt nombra la tarea, la familia de datasets, la estrategia de partición y el objetivo de salida. Por ejemplo, en lugar de pedir “ayuda con PyTDC”, pide:

“Carga un dataset de ADME en pytdc, usa un scaffold split y prepara un flujo base de regresión.”
“Muestra una pytdc guide para benchmarking de DTI con particiones train/validation/test e informe de métricas.”
“Configura pytdc for Data Analysis sobre un dataset de toxicidad y resume el equilibrio de etiquetas, los valores faltantes y el diseño de la partición.”

Esos detalles ayudan a la skill a elegir la ruta de tarea correcta y a evitar código genérico que no coincide con tu experimento.

Flujo de trabajo que suele funcionar mejor

Primero identifica la tarea terapéutica, luego confirma la clase de dataset y la política de partición, y después carga los datos e inspecciona las etiquetas antes de modelar. Si vas a hacer benchmarking, decide pronto si necesitas un scaffold split, un cold split u otra configuración de evaluación predefinida, porque esa decisión afecta más la comparabilidad que la elección del modelo.

Preguntas frecuentes sobre la skill `pytdc`

¿`pytdc` es solo para modelos de descubrimiento de fármacos?

En su mayoría, sí. La skill pytdc está pensada para casos de uso de ML terapéutico y farmacología, especialmente datasets y benchmarks más que análisis tabular de propósito general. Si tu proyecto no tiene que ver con compuestos, proteínas o tareas de interacción farmacológica, probablemente otra skill encaje mejor.

¿Necesito experiencia con PyTDC antes de usar la skill?

No. La skill es útil para principiantes que pueden describir un objetivo de dataset en lenguaje sencillo. Lo más importante es ser específico sobre la tarea objetivo, el split deseado y si necesitas análisis, predicción o generación.

¿En qué se diferencia de un prompt normal?

Un prompt normal puede describir pasos puntuales de carga o modelado, pero la skill pytdc es más útil cuando necesitas acceso reproducible a datos y disciplina de benchmarking. Eso es especialmente importante cuando necesitas particiones estándar y convenciones de evaluación que faciliten comparar resultados.

¿Cuándo no debería usar `pytdc`?

No uses pytdc si no necesitas datasets de TDC ni benchmarks terapéuticos, o si solo quieres una visión general de conceptos de química medicinal. Tampoco es la mejor opción si tus datos son propietarios y no están relacionados con las familias de tareas terapéuticas compatibles.

Cómo mejorar la skill `pytdc`

Indica primero la tarea, antes que la idea de modelo

La mejora más útil para una solicitud de pytdc es un encuadre del problema más claro. Di si necesitas predicción de propiedades, DTI, DDI, generación de moléculas o retrosíntesis antes de mencionar arquitecturas o métricas. Eso permite a la skill elegir el dataset y los supuestos de preprocesamiento correctos.

Especifica expectativas de split y métricas

Muchos fallos vienen de una evaluación poco definida. Si te importa un scaffold split, un cold split, ROC-AUC, PR-AUC, RMSE o métricas de ranking, dilo desde el principio en tu prompt de pytdc. La salida mejora mucho cuando la estrategia de partición y la métrica quedan fijadas antes de empezar la discusión sobre el modelado.

Comparte tus restricciones y la forma de tus datos

Si necesitas código listo para notebook, una auditoría ligera de datos o compatibilidad con un stack concreto, inclúyelo en la solicitud. Para pytdc for Data Analysis, indica si quieres balance de clases, comprobaciones de valores faltantes, resúmenes de descriptores o revisión de riesgo de fuga entre train y test, para que la salida se centre en los diagnósticos adecuados.

Itera afinando el objetivo del dataset

Si la primera respuesta es demasiado amplia, acótala por familia de dataset, tipo de tarea y formato de salida. Un mejor seguimiento podría ser: “Mantén el mismo flujo de trabajo de pytdc, pero cámbialo a clasificación de toxicidad, usa un scaffold split y devuelve solo los pasos de carga de datos y evaluación.”

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

chdb-datastore es una skill compatible con pandas para realizar análisis de datos rápidos con una DataStore API respaldada por ClickHouse. Admite conectores de archivos, bases de datos y nube, joins entre distintas fuentes y cambios mínimos de código en flujos de trabajo al estilo pandas. Usa esta guía de chdb-datastore cuando busques una capa de análisis lista para usar sobre conjuntos de datos grandes.

Data Analysis

Favoritos 0GitHub 0

sympy

por K-Dense-AI

Usa la skill sympy para matemáticas simbólicas exactas en Python, incluyendo álgebra, cálculo, matrices, fórmulas de física, teoría de números, geometría y generación de código. Te ayuda a mantener las expresiones exactas, elegir los módulos adecuados de SymPy y evitar errores típicos por depender demasiado de floats. Es ideal para quienes necesitan una guía práctica de sympy para flujos de trabajo simbólicos y sympy para análisis de datos.

Data Analysis

Favoritos 0GitHub 21.4k

interpreting-culture-index

por trailofbits

interpreting-culture-index ayuda a interpretar encuestas de Culture Index, exportaciones de perfiles y notas relacionadas con contratación o coaching. Usa esta skill interpreting-culture-index para evaluar ajuste al rol, dinámica de equipo, riesgo de burnout, sesiones de feedback de candidatos, planes de onboarding y mediación de conflictos. Hace énfasis en la lectura relativa de flechas, la detección de anti-patrones y resultados prácticos para análisis de datos y apoyo a decisiones.

Data Analysis

Favoritos 0GitHub 5k

azure-search-documents-py

por microsoft

azure-search-documents-py es la skill de Azure AI Search en Python para desarrollo backend, y cubre instalación, autenticación, diseño de índices, búsqueda vectorial, búsqueda híbrida, ranking semántico y recuperación agentic. Usa la skill azure-search-documents-py cuando necesites orientación práctica, desde la configuración inicial hasta patrones de consulta funcionales.

Backend Development

Favoritos 0GitHub 2.3k

gget

por K-Dense-AI

gget es una skill de bioinformática para acceder de forma rápida y unificada a más de 20 bases de datos genómicas y herramientas de análisis desde CLI o Python. Úsala para información de genes, búsquedas relacionadas con BLAST, estructuras de AlphaFold, datos de expresión, asociaciones con enfermedades y análisis de enriquecimiento. Encaja bien para exploración rápida y flujos de trabajo de análisis de datos con gget.

Data Analysis

Favoritos 0GitHub 0

torch-geometric

por K-Dense-AI

Guía de torch-geometric para redes neuronales gráficas con PyTorch Geometric. Úsala para ayuda de instalación de torch-geometric, uso de torch-geometric, clasificación de grafos, clasificación de nodos, predicción de enlaces, grafos heterogéneos, capas `MessagePassing` personalizadas y escalado de GNN en flujos de trabajo de Machine Learning.

Machine Learning

Favoritos 0GitHub 21.4k

rdkit

por K-Dense-AI

La skill de rdkit ayuda a trabajar con flujos de quimioinformática de alta precisión: analizar SMILES, SDF, MOL, PDB e InChI; calcular descriptores; generar fingerprints; ejecutar búsquedas de subestructuras; manejar reacciones; y crear coordenadas 2D/3D. Usa esta guía de rdkit para control avanzado, sanitización personalizada y flujos de rdkit para análisis de datos.

Data Analysis

Favoritos 0GitHub 21.4k

huggingface-vision-trainer

por huggingface

huggingface-vision-trainer te ayuda a instalar y usar una skill de Hugging Face para trabajos de entrenamiento de visión: detección de objetos, clasificación de imágenes y segmentación con SAM/SAM2. Cubre preparación de datasets, configuración de GPU en la nube, evaluación, registro con Trackio y publicación de resultados en el Hub. Es ideal para automatización en backend y flujos de entrenamiento repetibles.

Backend Development

Favoritos 0GitHub 10.4k

seo-dataforseo

por AgriciDaniel

seo-dataforseo conecta Claude con datos SEO en vivo a través del servidor MCP de DataForSEO para comprobar SERP, investigar palabras clave, analizar backlinks y on-page, estudiar la competencia, revisar fichas de negocio y seguir la visibilidad en IA. Es ideal para flujos de trabajo basados en datos cuando necesitas evidencia real de búsqueda, una guía de instalación clara y un uso práctico de seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

pymc

por K-Dense-AI

PyMC es un skill de modelado bayesiano para construir, ajustar, comprobar y comparar modelos probabilísticos en Python. Usa pymc para regresión jerárquica, análisis multivel, series temporales, datos faltantes, error de medición y comparación de modelos con LOO o WAIC.

Data Analysis

Favoritos 0GitHub 0

pymatgen

por K-Dense-AI

pymatgen es un kit de herramientas de ciencia de materiales en Python para estructuras cristalinas, diagramas de fases, estructura electrónica y conversión de archivos. Esta skill de pymatgen ayuda en flujos de trabajo científicos con CIF, POSCAR, VASP y datos de Materials Project.

Scientific

Favoritos 0GitHub 0

geopandas

por K-Dense-AI

Skill de geopandas para análisis de datos vectoriales geoespaciales en Python, incluyendo shapefiles, GeoJSON y archivos GeoPackage. Úsalo para leer, limpiar, unir, generar buffers, recortar, reproyectar y exportar datos espaciales con menos margen de error.

Data Analysis

Favoritos 0GitHub 0

analyzing-threat-intelligence-feeds

por mukul975

analyzing-threat-intelligence-feeds te ayuda a ingerir feeds de CTI, normalizar indicadores, evaluar la calidad de los feeds y enriquecer IOCs para flujos de trabajo STIX 2.1. Esta skill de analyzing-threat-intelligence-feeds está pensada para operaciones de inteligencia de amenazas y análisis de datos, con orientación práctica para TAXII, MISP y feeds comerciales.

Data Analysis

Favoritos 0GitHub 0

azure-ai-textanalytics-py

por microsoft

azure-ai-textanalytics-py es una skill para Azure AI Text Analytics en Python. Sirve para análisis de sentimiento, reconocimiento de entidades, extracción de frases clave, detección de idioma, detección de PII y NLP para salud. Úsala cuando necesites una vía rápida para configurar clientes de Azure, autenticación y uso práctico de análisis de texto en apps, notebooks o flujos de análisis de datos.

Data Analysis

Favoritos 0GitHub 0

chdb-sql

por ClickHouse

chdb-sql es una skill de GitHub para ejecutar SQL de ClickHouse en Python sin un servidor. Cubre `chdb.query()`, `Session`, conexiones DB-API, funciones de tabla como `file()` y `s3()`, consultas parametrizadas y flujos de trabajo de desarrollo backend con archivos locales y fuentes de datos externas.

Backend Development

Favoritos 0GitHub 0

pytdc

Resumen de la skill pytdc

Para qué sirve pytdc

Quién debería instalarla

Por qué importa

Cómo usar la skill pytdc

Instala pytdc en tu entorno

Empieza por los archivos correctos

Convierte un objetivo vago en un prompt útil

Flujo de trabajo que suele funcionar mejor

Preguntas frecuentes sobre la skill pytdc

¿pytdc es solo para modelos de descubrimiento de fármacos?

¿Necesito experiencia con PyTDC antes de usar la skill?

¿En qué se diferencia de un prompt normal?

¿Cuándo no debería usar pytdc?

Cómo mejorar la skill pytdc

Indica primero la tarea, antes que la idea de modelo

Especifica expectativas de split y métricas

Comparte tus restricciones y la forma de tus datos

Itera afinando el objetivo del dataset

Calificaciones y reseñas

Resumen de la skill `pytdc`

Para qué sirve `pytdc`

Cómo usar la skill `pytdc`

Instala `pytdc` en tu entorno

Preguntas frecuentes sobre la skill `pytdc`

¿`pytdc` es solo para modelos de descubrimiento de fármacos?

¿Cuándo no debería usar `pytdc`?

Cómo mejorar la skill `pytdc`