Data Processing

Data Processing taxonomy generated by the site skill importer.

15 skills
A
regex-vs-llm-structured-text

par affaan-m

Skill regex-vs-llm-structured-text pour choisir entre regex et LLM dans l’extraction de texte structuré. Commencez par un parsing déterministe, ajoutez une validation par LLM pour les cas limites à faible confiance, et utilisez un pipeline plus économique et plus fiable pour les documents, formulaires, factures et l’analyse de données.

Data Analysis
Favoris 0GitHub 156.2k
K
omero-integration

par K-Dense-AI

Le skill omero-integration pour les workflows Python OMERO en développement backend. Connectez-vous à OMERO, récupérez des projets, des jeux de données, des images, des ROIs, des annotations et des tables, et lancez des scripts par lots avec moins d’incertitude.

Backend Development
Favoris 0GitHub 21.3k
K
hypogenic

par K-Dense-AI

hypogenic est un outil pour générer et tester des hypothèses sur des jeux de données tabulaires ou issus de texte, avec l’aide d’un LLM. Il aide à appliquer hypogenic à l’analyse de données en transformant des questions empiriques en workflows structurés et testables pour l’interprétation de classifications, l’analyse de contenu et la détection de tromperie. À utiliser quand il vous faut des hypothèses étayées par des preuves, pas seulement du brainstorming.

Data Analysis
Favoris 0GitHub 21.3k
K
dnanexus-integration

par K-Dense-AI

dnanexus-integration est une compétence pratique pour les workflows de génomique cloud sur DNAnexus. Servez-vous-en pour créer des apps et applets, gérer les importations et exportations, exécuter des workflows et automatiser des pipelines avec dxpy. Le guide dnanexus-integration aide pour les tâches de développement backend impliquant des fichiers FASTQ, BAM et VCF, ainsi que la configuration spécifique à la plateforme et l’exécution des jobs.

Backend Development
Favoris 0GitHub 21.3k
H
huggingface-datasets

par huggingface

Utilisez le skill huggingface-datasets pour les workflows de l’API Hugging Face Dataset Viewer afin de valider des datasets, résoudre les splits, prévisualiser et paginer les lignes, rechercher du texte, appliquer des filtres, et récupérer des liens Parquet ou des statistiques. C’est un guide pratique huggingface-datasets pour explorer des datasets en lecture seule.

Web Scraping
Favoris 0GitHub 10.4k
V
Workspace Data Analyst

par VoltAgent

Workspace Data Analyst est une skill légère d’analyse de données dans votre espace de travail. Elle analyse les fichiers CSV, vérifie les en-têtes, résume les totaux, les moyennes et les valeurs atypiques, puis fournit des pistes d’action concises. La skill Workspace Data Analyst est idéale pour un premier examen rapide de fichiers contextualisés avant une modélisation plus poussée.

Data Analysis
Favoris 0GitHub 8.5k
M
azure-storage-file-datalake-py

par microsoft

azure-storage-file-datalake-py est le skill Python pour Azure Data Lake Storage Gen2. Il aide les développeurs back-end et les agents à installer, authentifier et utiliser le SDK Azure pour des tâches de système de fichiers hiérarchique comme l তাল?

Backend Development
Favoris 0GitHub 2.3k
M
azure-cosmos-py

par microsoft

La skill azure-cosmos-py vous aide à installer, configurer et utiliser le SDK Python Azure Cosmos DB pour le CRUD NoSQL, les requêtes, la configuration des conteneurs, le partitionnement et l’authentification. Elle est particulièrement utile pour les workflows d’ingénierie de bases de données où les clés de partition et le coût des requêtes comptent.

Database Engineering
Favoris 0GitHub 2.2k
C
clickhouse-best-practices

par ClickHouse

clickhouse-best-practices est un skill de bonnes pratiques ClickHouse pour l’ingénierie des bases de données. Il guide la conception du schéma, l’optimisation des requêtes, la stratégie d’insertion et la connexion des agents avec des recommandations fondées sur des règles, afin de faciliter le déclenchement, la revue et la citation de l’usage de clickhouse-best-practices dans les workflows ClickHouse.

Database Engineering
Favoris 0GitHub 412
T
tinybird

par tinybirdco

Bonnes pratiques Tinybird pour les fichiers de projet, les règles SQL, les schémas d’optimisation et les workflows basés sur les fichiers. Utilisez cette skill tinybird pour le Backend Development lorsque vous avez besoin d’aide sur les datasources, pipes, endpoints, materialized views et d’un guide compatible avec le déploiement, fondé sur les règles du repo.

Backend Development
Favoris 0GitHub 16
K
pymatgen

par K-Dense-AI

pymatgen est une boîte à outils Python pour la science des matériaux, dédiée aux structures cristallines, aux diagrammes de phase, à la structure électronique et à la conversion de fichiers. Ce skill pymatgen aide à gérer des workflows scientifiques avec des données CIF, POSCAR, VASP et Materials Project.

Scientific
Favoris 0GitHub 0
K
exploratory-data-analysis

par K-Dense-AI

Le skill exploratory-data-analysis transforme des fichiers scientifiques en rapports d’EDA adaptés au format. Il détecte le type de fichier, résume la structure et la qualité, extrait les métadonnées clés et suggère les analyses à poursuivre. Utilisez-le pour l’exploratory-data-analysis dans l’analyse de données, en chimie, bioinformatique, microscopie, spectroscopie, protéomique, métabolomique et d’autres formats de fichiers scientifiques.

Data Analysis
Favoris 0GitHub 0
K
astropy

par K-Dense-AI

astropy est une boîte à outils Python pour les workflows d’astronomie et d’astrophysique. Utilisez ce skill astropy pour les coordonnées célestes, les unités, les fichiers FITS, les échelles de temps, les tables, le WCS, la cosmologie et l’analyse de données avec astropy. Il aide pour les tâches pratiques d’astronomie comme les transformations de coordonnées, la conversion d’unités et le traitement des données.

Data Analysis
Favoris 0GitHub 0
K
aeon

par K-Dense-AI

aeon est un skill Python compatible avec scikit-learn pour le machine learning sur séries temporelles. Utilisez-le pour la classification, la régression, le clustering, la prévision, la détection d’anomalies, la segmentation, la recherche de similarité et d’autres workflows sur données temporelles. Il convient aussi bien aux analyses univariées que multivariées lorsque vous avez besoin de méthodes spécialisées, au-delà du ML tabulaire générique.

Data Analysis
Favoris 0GitHub 0
S
postgres

par sanjay3290

La skill postgres vous permet d’inspecter des bases PostgreSQL en direct avec du SQL en lecture seule. Utilisez-la pour découvrir un schéma, vérifier des tables et analyser des données via des requêtes SELECT sur plusieurs connexions, avec une auto-sélection basée sur les descriptions. Elle est conçue pour les workflows d’ingénierie de bases de données et bloque les écritures comme INSERT, UPDATE, DELETE et DROP pour plus de sécurité.

Database Engineering
Favoris 0GitHub 0
Data Processing