Data Processing

Data Processing taxonomy generated by the site skill importer.

15 skills
A
regex-vs-llm-structured-text

por affaan-m

Skill regex-vs-llm-structured-text para elegir entre regex o un LLM en la extracción de texto estructurado. Empieza con un parsing determinista, añade validación con LLM para casos límite de baja confianza y usa un pipeline más económico y fiable para documentos, formularios, facturas y análisis de datos.

Data Analysis
Favoritos 0GitHub 156.2k
K
omero-integration

por K-Dense-AI

Skill de omero-integration para flujos de trabajo de OMERO en desarrollo backend. Conéctate a OMERO, recupera proyectos, conjuntos de datos, imágenes, ROIs, anotaciones y tablas, y ejecuta scripts por lotes con menos margen de error.

Backend Development
Favoritos 0GitHub 21.3k
K
hypogenic

por K-Dense-AI

hypogenic es una skill para generar y probar hipótesis sobre conjuntos de datos tabulares o derivados de texto con apoyo de LLM. Ayuda con hypogenic para análisis de datos al convertir preguntas empíricas en flujos de trabajo estructurados y comprobables para interpretación de clasificaciones, análisis de contenido y detección de engaños. Úsala cuando necesites hipótesis respaldadas por evidencia, no solo lluvia de ideas.

Data Analysis
Favoritos 0GitHub 21.3k
K
dnanexus-integration

por K-Dense-AI

dnanexus-integration es una habilidad práctica para trabajar con genómica en la nube de DNAnexus. Úsala para crear apps y applets, gestionar subidas y descargas, ejecutar workflows y automatizar pipelines con dxpy. La guía de dnanexus-integration ayuda en tareas de Desarrollo Backend que implican archivos FASTQ, BAM y VCF, además de configuración específica de la plataforma y ejecución de jobs.

Backend Development
Favoritos 0GitHub 21.3k
H
huggingface-datasets

por huggingface

Usa la skill huggingface-datasets para flujos de trabajo con la API de Dataset Viewer de Hugging Face: validar datasets, resolver splits, previsualizar y paginar filas, buscar texto, aplicar filtros y obtener enlaces de parquet o estadísticas. Es una guía práctica de huggingface-datasets para exploración de datasets en modo solo lectura.

Web Scraping
Favoritos 0GitHub 10.4k
V
Workspace Data Analyst

por VoltAgent

Workspace Data Analyst es una skill ligera para análisis de datos en tu espacio de trabajo. Analiza archivos CSV, revisa encabezados, resume totales, promedios y valores atípicos, y ofrece conclusiones breves con próximos pasos. La skill Workspace Data Analyst es ideal para revisiones rápidas de archivos antes de pasar a un modelado más profundo.

Data Analysis
Favoritos 0GitHub 8.5k
M
azure-storage-file-datalake-py

por microsoft

azure-storage-file-datalake-py es el skill en Python para Azure Data Lake Storage Gen2. Ayuda a desarrolladores backend y agentes a instalar, autenticarse y usar el SDK de Azure para tareas de sistema de archivos jerárquico como listar, subir, descargar y administrar directorios y archivos.

Backend Development
Favoritos 0GitHub 2.3k
M
azure-cosmos-py

por microsoft

La skill azure-cosmos-py te ayuda a instalar, configurar y usar el SDK de Python de Azure Cosmos DB para CRUD en NoSQL, consultas, configuración de contenedores, particionamiento y autenticación. Es especialmente útil en flujos de trabajo de ingeniería de bases de datos, donde importan la clave de partición y el costo de las consultas.

Database Engineering
Favoritos 0GitHub 2.2k
C
clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering
Favoritos 0GitHub 412
T
tinybird

por tinybirdco

Mejores prácticas de Tinybird para archivos de proyecto, reglas SQL, patrones de optimización y flujos de trabajo basados en archivos. Usa esta skill de tinybird para Backend Development cuando necesites ayuda con datasources, pipes, endpoints, materialized views y orientación segura para despliegues, basada en las reglas del repositorio.

Backend Development
Favoritos 0GitHub 16
K
pymatgen

por K-Dense-AI

pymatgen es un kit de herramientas de ciencia de materiales en Python para estructuras cristalinas, diagramas de fases, estructura electrónica y conversión de archivos. Esta skill de pymatgen ayuda en flujos de trabajo científicos con CIF, POSCAR, VASP y datos de Materials Project.

Scientific
Favoritos 0GitHub 0
K
exploratory-data-analysis

por K-Dense-AI

La skill exploratory-data-analysis convierte archivos científicos en informes de EDA adaptados al formato. Detecta el tipo de archivo, resume la estructura y la calidad, extrae metadatos clave y sugiere el siguiente análisis. Úsala para exploratory-data-analysis en Data Analysis aplicada a química, bioinformática, microscopía, espectroscopía, proteómica, metabolómica y otros formatos de archivo científicos.

Data Analysis
Favoritos 0GitHub 0
K
astropy

por K-Dense-AI

astropy es un conjunto de herramientas en Python para flujos de trabajo de astronomía y astrofísica. Usa esta skill de astropy para coordenadas celestes, unidades, archivos FITS, escalas de tiempo, tablas, WCS, cosmología y análisis de datos con astropy. Ayuda en tareas prácticas de astronomía como transformaciones de coordenadas, conversión de unidades y procesamiento de datos.

Data Analysis
Favoritos 0GitHub 0
K
aeon

por K-Dense-AI

aeon es una herramienta de Python compatible con scikit-learn para machine learning de series temporales. Úsala para clasificación, regresión, clustering, pronóstico, detección de anomalías, segmentación, búsqueda de similitud y otros flujos de trabajo con datos temporales. Encaja tanto en análisis univariados como multivariados cuando necesitas métodos especializados más allá del ML tabular genérico.

Data Analysis
Favoritos 0GitHub 0
S
postgres

por sanjay3290

La skill de postgres te permite inspeccionar bases de datos PostgreSQL en vivo con SQL de solo lectura. Úsala para descubrir el esquema, comprobar tablas y analizar datos con SELECT en varias conexiones mediante selección automática basada en descripciones. Está pensada para flujos de trabajo de Database Engineering y bloquea escrituras como INSERT, UPDATE, DELETE y DROP para mayor seguridad.

Database Engineering
Favoritos 0GitHub 0
Data Processing