Data Processing

Data Processing taxonomy generated by the site skill importer.

17 skills

regex-vs-llm-structured-text

por affaan-m

Skill regex-vs-llm-structured-text para elegir entre regex o un LLM en la extracción de texto estructurado. Empieza con un parsing determinista, añade validación con LLM para casos límite de baja confianza y usa un pipeline más económico y fiable para documentos, formularios, facturas y análisis de datos.

Data Analysis

Favoritos 0GitHub 156.2k

college-football-data-automation

por ComposioHQ

college-football-data-automation ayuda a los agentes a automatizar tareas de College Football Data mediante Rube MCP y Composio. Aprende los requisitos de configuración, el descubrimiento de herramientas con `RUBE_SEARCH_TOOLS`, las comprobaciones de conexión y patrones prácticos de uso.

Workflow Automation

Favoritos 0GitHub 67.5k

cloudconvert-automation

por ComposioHQ

cloudconvert-automation ayuda a los agentes a ejecutar conversiones de formato con CloudConvert mediante Rube MCP: primero busca esquemas de herramientas en vivo, comprueba la conexión de cloudconvert y evita campos de API obsoletos.

Format Conversion

Favoritos 0GitHub 67.5k

omero-integration

por K-Dense-AI

Skill de omero-integration para flujos de trabajo de OMERO en desarrollo backend. Conéctate a OMERO, recupera proyectos, conjuntos de datos, imágenes, ROIs, anotaciones y tablas, y ejecuta scripts por lotes con menos margen de error.

Backend Development

Favoritos 0GitHub 21.3k

hypogenic

por K-Dense-AI

hypogenic es una skill para generar y probar hipótesis sobre conjuntos de datos tabulares o derivados de texto con apoyo de LLM. Ayuda con hypogenic para análisis de datos al convertir preguntas empíricas en flujos de trabajo estructurados y comprobables para interpretación de clasificaciones, análisis de contenido y detección de engaños. Úsala cuando necesites hipótesis respaldadas por evidencia, no solo lluvia de ideas.

Data Analysis

Favoritos 0GitHub 21.3k

dnanexus-integration

por K-Dense-AI

dnanexus-integration es una habilidad práctica para trabajar con genómica en la nube de DNAnexus. Úsala para crear apps y applets, gestionar subidas y descargas, ejecutar workflows y automatizar pipelines con dxpy. La guía de dnanexus-integration ayuda en tareas de Desarrollo Backend que implican archivos FASTQ, BAM y VCF, además de configuración específica de la plataforma y ejecución de jobs.

Backend Development

Favoritos 0GitHub 21.3k

huggingface-datasets

por huggingface

Usa la skill huggingface-datasets para flujos de trabajo con la API de Dataset Viewer de Hugging Face: validar datasets, resolver splits, previsualizar y paginar filas, buscar texto, aplicar filtros y obtener enlaces de parquet o estadísticas. Es una guía práctica de huggingface-datasets para exploración de datasets en modo solo lectura.

Web Scraping

Favoritos 0GitHub 10.4k

Workspace Data Analyst

por VoltAgent

Workspace Data Analyst es una skill ligera para análisis de datos en tu espacio de trabajo. Analiza archivos CSV, revisa encabezados, resume totales, promedios y valores atípicos, y ofrece conclusiones breves con próximos pasos. La skill Workspace Data Analyst es ideal para revisiones rápidas de archivos antes de pasar a un modelado más profundo.

Data Analysis

Favoritos 0GitHub 8.5k

azure-storage-file-datalake-py

por microsoft

azure-storage-file-datalake-py es el skill en Python para Azure Data Lake Storage Gen2. Ayuda a desarrolladores backend y agentes a instalar, autenticarse y usar el SDK de Azure para tareas de sistema de archivos jerárquico como listar, subir, descargar y administrar directorios y archivos.

Backend Development

Favoritos 0GitHub 2.3k

azure-cosmos-py

por microsoft

La skill azure-cosmos-py te ayuda a instalar, configurar y usar el SDK de Python de Azure Cosmos DB para CRUD en NoSQL, consultas, configuración de contenedores, particionamiento y autenticación. Es especialmente útil en flujos de trabajo de ingeniería de bases de datos, donde importan la clave de partición y el costo de las consultas.

Database Engineering

Favoritos 0GitHub 2.2k

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering

Favoritos 0GitHub 412

tinybird

por tinybirdco

Mejores prácticas de Tinybird para archivos de proyecto, reglas SQL, patrones de optimización y flujos de trabajo basados en archivos. Usa esta skill de tinybird para Backend Development cuando necesites ayuda con datasources, pipes, endpoints, materialized views y orientación segura para despliegues, basada en las reglas del repositorio.

Backend Development

Favoritos 0GitHub 16

pymatgen

por K-Dense-AI

pymatgen es un kit de herramientas de ciencia de materiales en Python para estructuras cristalinas, diagramas de fases, estructura electrónica y conversión de archivos. Esta skill de pymatgen ayuda en flujos de trabajo científicos con CIF, POSCAR, VASP y datos de Materials Project.

Scientific

Favoritos 0GitHub 0

exploratory-data-analysis

por K-Dense-AI

La skill exploratory-data-analysis convierte archivos científicos en informes de EDA adaptados al formato. Detecta el tipo de archivo, resume la estructura y la calidad, extrae metadatos clave y sugiere el siguiente análisis. Úsala para exploratory-data-analysis en Data Analysis aplicada a química, bioinformática, microscopía, espectroscopía, proteómica, metabolómica y otros formatos de archivo científicos.

Data Analysis

Favoritos 0GitHub 0

astropy

por K-Dense-AI

astropy es un conjunto de herramientas en Python para flujos de trabajo de astronomía y astrofísica. Usa esta skill de astropy para coordenadas celestes, unidades, archivos FITS, escalas de tiempo, tablas, WCS, cosmología y análisis de datos con astropy. Ayuda en tareas prácticas de astronomía como transformaciones de coordenadas, conversión de unidades y procesamiento de datos.

Data Analysis

Favoritos 0GitHub 0

aeon

por K-Dense-AI

aeon es una herramienta de Python compatible con scikit-learn para machine learning de series temporales. Úsala para clasificación, regresión, clustering, pronóstico, detección de anomalías, segmentación, búsqueda de similitud y otros flujos de trabajo con datos temporales. Encaja tanto en análisis univariados como multivariados cuando necesitas métodos especializados más allá del ML tabular genérico.

Data Analysis

Favoritos 0GitHub 0

postgres

por sanjay3290

La skill de postgres te permite inspeccionar bases de datos PostgreSQL en vivo con SQL de solo lectura. Úsala para descubrir el esquema, comprobar tablas y analizar datos con SELECT en varias conexiones mediante selección automática basada en descripciones. Está pensada para flujos de trabajo de Database Engineering y bloquea escrituras como INSERT, UPDATE, DELETE y DROP para mayor seguridad.

Database Engineering

Favoritos 0GitHub 0