rdkit

por K-Dense-AI

La skill de rdkit ayuda a trabajar con flujos de quimioinformática de alta precisión: analizar SMILES, SDF, MOL, PDB e InChI; calcular descriptores; generar fingerprints; ejecutar búsquedas de subestructuras; manejar reacciones; y crear coordenadas 2D/3D. Usa esta guía de rdkit para control avanzado, sanitización personalizada y flujos de rdkit para análisis de datos.

Estrellas21.4k

Favoritos0

Comentarios0

Agregado14 may 2026

CategoríaData Analysis

Comando de instalación

npx skills add K-Dense-AI/claude-scientific-skills --skill rdkit

Puntuación editorial

Esta skill obtiene 84/100, lo que significa que es una ficha sólida para quienes necesitan control específico de RDKit en quimioinformática. El repositorio muestra contenido real de trabajo, una guía clara de uso y scripts auxiliares que reducen las dudas frente a un prompt genérico, aunque está más orientado a referencia que a uso listo para empezar.

84/100

Puntos fuertes

Delimita de forma explícita cuándo usar rdkit frente a datamol, lo que ayuda a los agentes a elegir la herramienta adecuada para control molecular avanzado.
Incluye una cobertura amplia de flujos en SKILL.md, además de tres scripts de apoyo para propiedades, búsqueda por similitud y filtrado por subestructuras.
Se apoya en archivos de referencia para llamadas a la API, descriptores y patrones SMARTS, lo que mejora la activación por contexto y la claridad operativa.

Puntos a tener en cuenta

No hay comando de instalación en SKILL.md, así que puede ser necesario configurar el entorno por separado.
Parte del contenido está más orientada a referencia que a pasos secuenciales, por lo que la adopción inicial puede seguir requiriendo familiaridad con RDKit.

Python Chemistry Drug Discovery Bioinformatics

Resumen

Descripción general de la skill rdkit

Para qué sirve rdkit

La skill rdkit está pensada para tareas de quimioinformática que exigen un manejo molecular preciso: analizar SMILES, SDF/MOL/PDB/InChI, calcular descriptores, generar fingerprints, ejecutar búsquedas de subestructuras y trabajar con reacciones o coordenadas 2D/3D. Es especialmente útil cuando un simple prompt no basta y necesitas que la skill de rdkit aplique los patrones de API correctos, los pasos de sanitización adecuados y los formatos de archivo pertinentes.

Usuarios y tareas para los que encaja mejor

Usa esta guía de rdkit si haces limpieza de moléculas, cálculo de propiedades, cribado por similitud, filtrado de bibliotecas o preparación de datos basada en estructuras para discovery de fármacos y química computacional. También encaja muy bien para rdkit for Data Analysis cuando necesitas procesamiento por lotes reproducible sobre muchas moléculas en lugar de exploración puntual en un notebook.

En qué se diferencia esta skill

Esta skill de rdkit prioriza el control fino por encima de la comodidad. El repositorio admite uso directo de la API de Python, además de scripts auxiliares y archivos de referencia para descriptores, SMARTS y flujos de trabajo de similitud. Eso la hace más adecuada para control avanzado, sanitización personalizada y algoritmos especializados que un prompt genérico o un wrapper ligero.

Cómo usar la skill rdkit

Instálala y activa el contexto

Instala la skill en tu entorno de Claude skills y luego deja explícitos el origen de las moléculas, el objetivo de salida y las restricciones. Un buen flujo de instalación y uso de rdkit consiste en indicar tanto la tarea química como la forma de los datos, por ejemplo SMILES in CSV, SDF file, batch library o single query molecule.

Dale a la skill la entrada correcta

Las entradas sólidas incluyen el formato exacto de la estructura, la operación objetivo y cualquier regla química. Por ejemplo: “Usa rdkit para leer este SDF, eliminar las moléculas inválidas, calcular MW/LogP/TPSA y exportar un CSV con SMILES canónicos”. Si necesitas trabajo con subestructuras, incluye el patrón SMARTS y especifica si la coincidencia es inclusiva o excluyente.

Revisa primero estos archivos

Empieza por SKILL.md y después consulta references/api_reference.md, references/descriptors_reference.md y references/smarts_patterns.md para ver los métodos admitidos y la sintaxis de patrones. Si planeas automatizar trabajo por lotes, revisa scripts/molecular_properties.py, scripts/similarity_search.py y scripts/substructure_filter.py para entender la forma práctica del flujo de trabajo del repositorio.

Consejos de flujo de trabajo que mejoran el resultado

Conviene usar un prompt por etapas: parsear, validar, transformar y luego exportar. Indica si la sanitización debe ser estricta o permisiva, si la estereoquímica importa y si quieres SMILES canónicos o conservar el orden original. En el uso de rdkit, esto evita el fallo habitual en el que las moléculas se parsean bien, pero los descriptores o fingerprints posteriores se calculan sobre la forma equivocada.

Preguntas frecuentes sobre la skill rdkit

¿rdkit es mejor que un prompt normal?

Normalmente sí cuando la tarea depende de APIs exactas, E/S de archivos, sintaxis SMARTS o procesamiento por lotes. Un prompt normal puede describir conceptos de quimioinformática, pero la skill rdkit es mejor cuando necesitas una guía de instalación y uso de rdkit fiable, rutas de código concretas y menos suposiciones sobre los formatos de las moléculas.

¿Cuándo no debería usar rdkit?

No elijas rdkit si solo necesitas resúmenes moleculares de alto nivel con poco control. El propio repositorio señala que datamol puede ser un wrapper más simple alrededor de RDKit para flujos de trabajo estándar, así que rdkit encaja mejor cuando necesitas control directo de la API en lugar de comodidad.

¿Es apta para principiantes?

Sí, si acotas bien la tarea. Los principiantes pueden pedir usos sencillos de rdkit, como convertir SMILES en propiedades o filtrar moléculas por un patrón SMARTS. El principal bloqueo suele no ser el conocimiento de química, sino una entrada ambigua: tipo de archivo poco claro, reglas de carga o estereoquímica ausentes, o falta de un esquema de salida definido.

¿Qué puedo esperar del ecosistema?

Espera flujos de trabajo centrados en Python, con módulos de RDKit, scripts auxiliares y tablas de referencia, más que un gran framework de aplicación. La skill rdkit funciona mejor cuando ya conoces el origen de las moléculas y quieres una canalización práctica de análisis o transformación.

Cómo mejorar la skill rdkit

Empieza por la decisión más importante

La mayor mejora de calidad viene de especificar la representación molecular y el criterio de éxito. Indica a la skill de rdkit si la tarea es cálculo de descriptores, búsqueda por similitud, filtrado por subestructuras o conversión estructural, y define qué cuenta como resultado válido, por ejemplo: “solo moléculas sanitizadas” o “conservar intacta la estereoquímica”.

Incluye desde el principio las restricciones químicas

Los fallos más comunes vienen de supuestos ocultos sobre sales, tautómeros, hidrógenos explícitos, aromaticidad y estructuras inválidas. Si eso importa, dilo de forma directa: por ejemplo, “elimina las sales antes de calcular descriptores”, “preserva la estereoquímica original” o “trata un fallo de sanitización como rechazo, no como reparación”.

Usa patrones de prompt concretos

Los prompts más fuertes se parecen a esto: “Usando rdkit, lee molecules.smi, rechaza los SMILES inválidos, calcula MW, LogP y TPSA, y genera un CSV con SMILES canónicos y una marca passed”. Es mejor que “analiza estas moléculas”, porque le dice a la skill qué parsear, qué calcular y cómo formatear el resultado.

Itera sobre la calidad de salida, no solo sobre el código

Después del primer intento, comprueba si el resultado encaja con tus reglas químicas y con tu cadena de herramientas posterior. Si algo no cuadra, afina el prompt añadiendo una sola restricción cada vez: tipo de fingerprint, librería SMARTS, conjunto de descriptores o formato de exportación. Para rdkit for Data Analysis, esto suele mejorar más la reproducibilidad que pedir más funciones.

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

chdb-datastore es una skill compatible con pandas para realizar análisis de datos rápidos con una DataStore API respaldada por ClickHouse. Admite conectores de archivos, bases de datos y nube, joins entre distintas fuentes y cambios mínimos de código en flujos de trabajo al estilo pandas. Usa esta guía de chdb-datastore cuando busques una capa de análisis lista para usar sobre conjuntos de datos grandes.

Data Analysis

Favoritos 0GitHub 0

sympy

por K-Dense-AI

Usa la skill sympy para matemáticas simbólicas exactas en Python, incluyendo álgebra, cálculo, matrices, fórmulas de física, teoría de números, geometría y generación de código. Te ayuda a mantener las expresiones exactas, elegir los módulos adecuados de SymPy y evitar errores típicos por depender demasiado de floats. Es ideal para quienes necesitan una guía práctica de sympy para flujos de trabajo simbólicos y sympy para análisis de datos.

Data Analysis

Favoritos 0GitHub 21.4k

interpreting-culture-index

por trailofbits

interpreting-culture-index ayuda a interpretar encuestas de Culture Index, exportaciones de perfiles y notas relacionadas con contratación o coaching. Usa esta skill interpreting-culture-index para evaluar ajuste al rol, dinámica de equipo, riesgo de burnout, sesiones de feedback de candidatos, planes de onboarding y mediación de conflictos. Hace énfasis en la lectura relativa de flechas, la detección de anti-patrones y resultados prácticos para análisis de datos y apoyo a decisiones.

Data Analysis

Favoritos 0GitHub 5k

azure-search-documents-py

por microsoft

azure-search-documents-py es la skill de Azure AI Search en Python para desarrollo backend, y cubre instalación, autenticación, diseño de índices, búsqueda vectorial, búsqueda híbrida, ranking semántico y recuperación agentic. Usa la skill azure-search-documents-py cuando necesites orientación práctica, desde la configuración inicial hasta patrones de consulta funcionales.

Backend Development

Favoritos 0GitHub 2.3k

gget

por K-Dense-AI

gget es una skill de bioinformática para acceder de forma rápida y unificada a más de 20 bases de datos genómicas y herramientas de análisis desde CLI o Python. Úsala para información de genes, búsquedas relacionadas con BLAST, estructuras de AlphaFold, datos de expresión, asociaciones con enfermedades y análisis de enriquecimiento. Encaja bien para exploración rápida y flujos de trabajo de análisis de datos con gget.

Data Analysis

Favoritos 0GitHub 0

torch-geometric

por K-Dense-AI

Guía de torch-geometric para redes neuronales gráficas con PyTorch Geometric. Úsala para ayuda de instalación de torch-geometric, uso de torch-geometric, clasificación de grafos, clasificación de nodos, predicción de enlaces, grafos heterogéneos, capas `MessagePassing` personalizadas y escalado de GNN en flujos de trabajo de Machine Learning.

Machine Learning

Favoritos 0GitHub 21.4k

huggingface-vision-trainer

por huggingface

huggingface-vision-trainer te ayuda a instalar y usar una skill de Hugging Face para trabajos de entrenamiento de visión: detección de objetos, clasificación de imágenes y segmentación con SAM/SAM2. Cubre preparación de datasets, configuración de GPU en la nube, evaluación, registro con Trackio y publicación de resultados en el Hub. Es ideal para automatización en backend y flujos de entrenamiento repetibles.

Backend Development

Favoritos 0GitHub 10.4k

seo-dataforseo

por AgriciDaniel

seo-dataforseo conecta Claude con datos SEO en vivo a través del servidor MCP de DataForSEO para comprobar SERP, investigar palabras clave, analizar backlinks y on-page, estudiar la competencia, revisar fichas de negocio y seguir la visibilidad en IA. Es ideal para flujos de trabajo basados en datos cuando necesitas evidencia real de búsqueda, una guía de instalación clara y un uso práctico de seo-dataforseo.

Keyword Research

Favoritos 0GitHub 6.2k

pymc

por K-Dense-AI

PyMC es un skill de modelado bayesiano para construir, ajustar, comprobar y comparar modelos probabilísticos en Python. Usa pymc para regresión jerárquica, análisis multivel, series temporales, datos faltantes, error de medición y comparación de modelos con LOO o WAIC.

Data Analysis

Favoritos 0GitHub 0

pymatgen

por K-Dense-AI

pymatgen es un kit de herramientas de ciencia de materiales en Python para estructuras cristalinas, diagramas de fases, estructura electrónica y conversión de archivos. Esta skill de pymatgen ayuda en flujos de trabajo científicos con CIF, POSCAR, VASP y datos de Materials Project.

Scientific

Favoritos 0GitHub 0

geopandas

por K-Dense-AI

Skill de geopandas para análisis de datos vectoriales geoespaciales en Python, incluyendo shapefiles, GeoJSON y archivos GeoPackage. Úsalo para leer, limpiar, unir, generar buffers, recortar, reproyectar y exportar datos espaciales con menos margen de error.

Data Analysis

Favoritos 0GitHub 0

analyzing-threat-intelligence-feeds

por mukul975

analyzing-threat-intelligence-feeds te ayuda a ingerir feeds de CTI, normalizar indicadores, evaluar la calidad de los feeds y enriquecer IOCs para flujos de trabajo STIX 2.1. Esta skill de analyzing-threat-intelligence-feeds está pensada para operaciones de inteligencia de amenazas y análisis de datos, con orientación práctica para TAXII, MISP y feeds comerciales.

Data Analysis

Favoritos 0GitHub 0

azure-ai-textanalytics-py

por microsoft

azure-ai-textanalytics-py es una skill para Azure AI Text Analytics en Python. Sirve para análisis de sentimiento, reconocimiento de entidades, extracción de frases clave, detección de idioma, detección de PII y NLP para salud. Úsala cuando necesites una vía rápida para configurar clientes de Azure, autenticación y uso práctico de análisis de texto en apps, notebooks o flujos de análisis de datos.

Data Analysis

Favoritos 0GitHub 0

chdb-sql

por ClickHouse

chdb-sql es una skill de GitHub para ejecutar SQL de ClickHouse en Python sin un servidor. Cubre `chdb.query()`, `Session`, conexiones DB-API, funciones de tabla como `file()` y `s3()`, consultas parametrizadas y flujos de trabajo de desarrollo backend con archivos locales y fuentes de datos externas.

Backend Development

Favoritos 0GitHub 0

scvelo

por K-Dense-AI

scvelo es una skill en Python para el análisis de RNA velocity en datos de RNA-seq de célula única. Úsala para estimar transiciones entre estados celulares a partir de mRNA no empalmado y empalmado, inferir la dirección de las trayectorias, calcular tiempo latente e identificar genes impulsores. Es especialmente útil para scvelo en análisis de datos cuando necesitas direccionalidad más allá del clustering estándar o del pseudotiempo.

Data Analysis

Favoritos 0GitHub 0