scanpy

par K-Dense-AI

skill scanpy pour l’analyse de données RNA-seq single-cell en Python. Utilisez-le pour le contrôle qualité, la normalisation, la PCA, UMAP/t-SNE, le clustering, l’identification de gènes marqueurs, l’analyse de trajectoire et des graphiques de qualité publication. Idéal pour les workflows exploratoires de scRNA-seq centrés sur AnnData, avec des indications claires sur l’usage de scanpy et son installation.

Étoiles0

Favoris0

Commentaires0

Ajouté14 mai 2026

CatégorieData Analysis

Commande d’installation

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Score éditorial

Ce skill obtient 78/100, ce qui en fait une bonne candidate pour les utilisateurs du répertoire qui recherchent un workflow Scanpy prêt à l’emploi plutôt qu’un prompt générique. Le dépôt montre un skill single-cell RNA-seq substantiel, sans contenu factice, avec des cas d’usage clairs, des étapes de workflow concrètes et une structure suffisante pour aider un agent à l’exécuter et à l’appliquer avec moins d’hésitation.

78/100

Points forts

Ciblé explicitement sur les tâches scRNA-seq courantes : QC, normalisation, PCA/UMAP/t-SNE, clustering, gènes marqueurs et analyse de trajectoire.
Contenu SKILL.md conséquent avec frontmatter valide, texte développé, nombreux titres et exemples de code, ce qui favorise une utilisation opérationnelle.
Inclut des limites d’usage et des conseils sur les skills associés, aidant les agents à choisir Scanpy pour l’analyse exploratoire single-cell et à orienter ailleurs les demandes sur le deep learning ou sur des questions très spécifiques à AnnData.

Points de vigilance

Aucune commande d’installation, aucun fichier d’assistance ni référence externe ne sont fournis ; l’adoption repose donc surtout sur les instructions écrites du skill.
Le dépôt semble purement documentaire : les utilisateurs doivent s’attendre à un guide de workflow plutôt qu’à une automatisation packagée ou à des scripts testés.

Scanpy Python Scientific Single Cell Bioinformatics Genomics Jupyter

Vue d’ensemble

Aperçu du skill scanpy

À quoi sert scanpy

Le skill scanpy sert à analyser des données de RNA-seq monocellulaire en Python : contrôle qualité, normalisation, sélection de caractéristiques, PCA, UMAP/t-SNE, clustering, identification de marqueurs et analyse exploratoire de type trajectoire. Il est particulièrement adapté si vous disposez déjà d’un objet AnnData ou si vous pouvez en créer un, et si vous cherchez un guide pratique scanpy pour l’analyse de données plutôt qu’un workflow centré sur le deep learning.

À qui il s’adresse

Utilisez le skill scanpy si vous travaillez sur des données scRNA-seq, si vous transformez des comptes bruts en un objet prêt pour l’analyse, ou si vous préparez des figures et des annotations de clusters pour l’interprétation ou la publication. Il convient aux analystes qui veulent un pipeline exploratoire standard et savent qu’ils ont besoin d’instructions d’installation et d’utilisation de scanpy, pas d’une introduction générale à la bioinformatique.

Ce qui le distingue

Ce dépôt met l’accent sur le flux de travail Scanpy le plus courant plutôt que sur une vue théorique large : chargement des données, prétraitement, projection, clustering et visualisation. Il clarifie aussi mieux les limites — si vous avez besoin de modèles génératifs profonds, tournez-vous vers scvi-tools ; si votre principal sujet concerne la structure AnnData ou les formats de fichiers, anndata est un meilleur point de départ.

Comment utiliser le skill scanpy

Installer et vérifier le skill

Installez le skill scanpy dans le flux de travail habituel du répertoire, puis ouvrez le fichier du skill avant de formuler votre demande :

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Après l’installation, lisez d’abord scientific-skills/scanpy/SKILL.md, puis suivez les éventuelles sections liées dans le fichier. Il n’y a ici ni scripts d’aide supplémentaires ni dossiers de référence : le texte du skill est donc la principale source de vérité.

Donner au modèle des entrées prêtes pour l’analyse

Les meilleurs prompts pour scanpy précisent la forme, le format et l’objectif des données. Indiquez si votre entrée est un fichier .h5ad, une sortie 10X ou une matrice de comptes ; combien d’échantillons ou de lots vous avez ; si vous avez besoin de seuils de QC, d’intégration, de clustering ou de graphiques ; et quel résultat vous attendez. Un prompt faible dit simplement « analyse mes données scRNA-seq » ; un meilleur prompt dit « utilise scanpy pour charger deux jeux de données 10X, filtrer les cellules de faible qualité, normaliser, calculer PCA/UMAP, regrouper à plusieurs résolutions et identifier les gènes marqueurs de chaque cluster ».

Suivre un flux de travail pratique

Pour la plupart des tâches, procédez dans cet ordre : charger les données, inspecter obs/var, filtrer les cellules et gènes de faible qualité, normaliser et transformer en log, sélectionner les gènes hautement variables, mettre à l’échelle et lancer la PCA, construire le graphe de voisins, calculer UMAP, faire le clustering, puis classer les marqueurs ou visualiser des ensembles de gènes. Si vous avez déjà un AnnData traité, dites-le ; cela évite que le skill répète les étapes de préparation et garde la réponse centrée sur les décisions d’analyse manquantes.

Lire d’abord les bonnes sections

Commencez par le haut de SKILL.md, puis allez directement aux sections d’usage qui couvrent la configuration, le chargement, le prétraitement, les graphiques et l’analyse en aval. Si le dépôt mentionne des formats d’entrée ou des conventions précises, reprenez-les exactement dans votre prompt. L’objectif est de réduire les approximations avant que le modèle n’écrive du code ou des étapes d’analyse.

FAQ du skill scanpy

scanpy est-il réservé au scRNA-seq ?

Oui, principalement. Le skill scanpy est centré sur les workflows de transcriptomique monocellulaire, en particulier l’analyse exploratoire de matrices d’expression génique. Ce n’est pas le bon choix pour le RNA-seq en bulk ni pour des tâches de modélisation mieux prises en charge par des outils spécialisés de deep learning pour le single-cell.

Ai-je besoin du skill si je sais déjà bien prompter un modèle ?

Si vous connaissez déjà tout le workflow et les objets exacts, un prompt simple peut suffire. Le skill scanpy devient plus utile quand vous voulez un chemin d’analyse cohérent, moins d’étapes oubliées et de meilleurs réglages par défaut pour le contrôle qualité, le prétraitement, le clustering et la visualisation.

Est-il adapté aux débutants ?

Oui, dans le sens où le pipeline est standard et où le skill se concentre sur l’usage pratique de scanpy. Il suppose toutefois que vous comprenez les bases de Python, les concepts du single-cell et la différence entre comptes bruts, données normalisées et métadonnées annotées.

Quand ne faut-il pas l’utiliser ?

N’utilisez pas scanpy comme skill principal si votre problème concerne surtout la conversion de fichiers, la conception du schéma AnnData ou la création de modèles neuronaux pour l’inférence d’états cellulaires. Dans ces cas-là, un autre skill ou un autre outil donnera de meilleurs résultats que d’essayer de faire couvrir à scanpy toute la chaîne de travail.

Comment améliorer le skill scanpy

Donner les entrées qui changent les décisions

Les gains de qualité les plus importants viennent du fait de préciser la taille du jeu de données, l’organisme, la plateforme, la structure des lots et l’étape d’analyse dans laquelle vous vous trouvez déjà. Pour l’usage de scanpy, indiquez aussi s’il y a des risques d’ARN ambiant, un besoin de filtrage des doublets ou un ensemble connu de gènes marqueurs, car ces éléments influencent le contrôle qualité et l’interprétation.

Demander des livrables, pas seulement des étapes

Au lieu de demander une « analyse scanpy », demandez un livrable concret : un notebook de prétraitement, un workflow de clustering, un tableau de gènes marqueurs ou un bloc de visualisation avec UMAP et violin plots. Des objectifs de sortie clairs aident le modèle à choisir la bonne structure de guide scanpy et à éviter d’expliquer inutilement des bases dont vous n’avez pas besoin.

Repérer les modes d’échec les plus courants

Les erreurs les plus fréquentes sont d’omettre le contexte de QC, de mélanger couches brutes et normalisées, de lancer le clustering avant d’avoir vérifié les choix de voisins et de mise à l’échelle, et de demander des résultats sans définir la question biologique. Si votre première version est trop générale, réécrivez-la en précisant l’objet d’entrée exact, les noms de variables et la décision que l’analyse doit éclairer.

Itérer un seul contrainte à la fois

Après un premier jet, améliorez la réponse du skill scanpy en ajoutant une seule contrainte : « utiliser uniquement h5ad », « éviter l’intégration », « produire des graphiques de qualité publication » ou « conserver les labels de lot dans obs ». C’est généralement plus efficace qu’une réécriture globale, car cela garde le workflow stable tout en resserrant les points qui comptent pour votre tâche scanpy d’analyse de données.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

clickhouse-best-practices

par ClickHouse

clickhouse-best-practices est un skill de bonnes pratiques ClickHouse pour l’ingénierie des bases de données. Il guide la conception du schéma, l’optimisation des requêtes, la stratégie d’insertion et la connexion des agents avec des recommandations fondées sur des règles, afin de faciliter le déclenchement, la revue et la citation de l’usage de clickhouse-best-practices dans les workflows ClickHouse.

Database Engineering

Favoris 0GitHub 412

chdb-datastore

par ClickHouse

chdb-datastore est un skill compatible avec pandas pour une analyse de données rapide, avec une API DataStore adossée à ClickHouse. Il prend en charge les connecteurs de fichiers, de bases de données et de cloud, les jointures entre sources, et des changements de code minimes pour des workflows de type pandas. Utilisez ce guide chdb-datastore lorsque vous voulez une couche d’analyse prête à l’emploi pour des jeux de données plus volumineux.

Data Analysis

Favoris 0GitHub 0

sympy

par K-Dense-AI

Utilisez la compétence sympy pour faire des maths symboliques exactes en Python, notamment en algèbre, calcul, matrices, formules de physique, théorie des nombres, géométrie et génération de code. Elle vous aide à conserver des expressions exactes, à choisir les bons modules SymPy et à éviter les erreurs liées aux flottants. C’est un bon choix pour celles et ceux qui cherchent un guide pratique sympy pour des workflows symboliques et sympy pour l’analyse de données.

Data Analysis

Favoris 0GitHub 21.4k

interpreting-culture-index

par trailofbits

interpreting-culture-index aide à interpréter les enquêtes Culture Index, les exports de profils et les notes associées au recrutement ou au coaching. Utilisez ce skill interpreting-culture-index pour évaluer l’adéquation à un poste, la dynamique d’équipe, le risque d’épuisement, les débriefs de candidats, les plans d’onboarding et la médiation de conflits. Il met l’accent sur la lecture relative des flèches, les vérifications d’anti-patterns et des livrables concrets pour l’analyse de données et l’aide à la décision.

Data Analysis

Favoris 0GitHub 5k

azure-search-documents-py

par microsoft

azure-search-documents-py est le skill Python pour Azure AI Search dédié au développement backend, avec la configuration, l’authentification, la conception d’index, la recherche vectorielle, la recherche hybride, le classement sémantique et la récupération agentique. Utilisez le skill azure-search-documents-py lorsque vous avez besoin de conseils pratiques, de la mise en route aux schémas de requête réellement exploitables.

Backend Development

Favoris 0GitHub 2.3k

gget

par K-Dense-AI

gget est une skill de bioinformatique pour accéder rapidement et de façon unifiée à plus de 20 bases de données génomiques et outils d’analyse depuis le CLI ou Python. Utilisez-la pour obtenir des informations sur les gènes, faire des recherches liées à BLAST, consulter des structures AlphaFold, des données d’expression, des associations avec des maladies et des analyses de type enrichment. Elle convient bien à l’exploration rapide et aux workflows d’analyse de données avec gget.

Data Analysis

Favoris 0GitHub 0

torch-geometric

par K-Dense-AI

Guide du skill torch-geometric pour les réseaux de neurones graphiques PyTorch Geometric. Utilisez-le pour l’aide à l’installation de torch-geometric, l’utilisation de torch-geometric, la classification de graphes, la classification de nœuds, la prédiction de liens, les graphes hétérogènes, les couches MessagePassing personnalisées et la mise à l’échelle des GNN dans des workflows de Machine Learning.

Machine Learning

Favoris 0GitHub 21.4k

rdkit

par K-Dense-AI

Le skill RDKit aide à piloter avec précision des workflows de chimioinformatique : analyse de SMILES, SDF, MOL, PDB et InChI ; calcul de descripteurs ; génération d’empreintes ; recherche de sous-structures ; gestion de réactions ; et création de coordonnées 2D/3D. Utilisez ce guide RDKit pour un contrôle avancé, une sanitization personnalisée et des workflows RDKit pour l’analyse de données.

Data Analysis

Favoris 0GitHub 21.4k

huggingface-vision-trainer

par huggingface

huggingface-vision-trainer vous aide à installer et utiliser un skill Hugging Face pour des tâches d’entraînement vision : détection d’objets, classification d’images et segmentation SAM/SAM2. Il couvre la préparation des jeux de données, la configuration de GPU cloud, l’évaluation, la journalisation avec Trackio et l’envoi des résultats sur le Hub. Idéal pour l’automatisation backend et les workflows d’entraînement reproductibles.

Backend Development

Favoris 0GitHub 10.4k

seo-dataforseo

par AgriciDaniel

seo-dataforseo connecte Claude à des données SEO en temps réel via le serveur MCP DataForSEO pour vérifier les SERP, faire de la recherche de mots-clés, analyser les backlinks et les pages, étudier la concurrence, examiner les fiches d’établissement et suivre la visibilité dans les IA. C’est particulièrement adapté aux workflows fondés sur les données quand vous avez besoin de preuves issues des résultats de recherche, d’instructions d’installation claires et d’une utilisation concrète de seo-dataforseo.

Keyword Research

Favoris 0GitHub 6.2k

pymc

par K-Dense-AI

PyMC est un skill de modélisation bayésienne pour construire, ajuster, vérifier et comparer des modèles probabilistes en Python. Utilisez pymc pour la régression hiérarchique, l’analyse multiniveau, les séries temporelles, les données manquantes, l’erreur de mesure et la comparaison de modèles avec LOO ou WAIC.

Data Analysis

Favoris 0GitHub 0

pymatgen

par K-Dense-AI

pymatgen est une boîte à outils Python pour la science des matériaux, dédiée aux structures cristallines, aux diagrammes de phase, à la structure électronique et à la conversion de fichiers. Ce skill pymatgen aide à gérer des workflows scientifiques avec des données CIF, POSCAR, VASP et Materials Project.

Scientific

Favoris 0GitHub 0

geopandas

par K-Dense-AI

Skill geopandas pour l’analyse de données vectorielles géospatiales en Python, y compris les fichiers shapefiles, GeoJSON et GeoPackage. Utilisez-le pour lire, nettoyer, joindre, créer des buffers, découper, reprojeter et exporter des données spatiales avec moins d’hésitation.

Data Analysis

Favoris 0GitHub 0

analyzing-threat-intelligence-feeds

par mukul975

Analyzing-threat-intelligence-feeds vous aide à ingérer des flux CTI, normaliser des indicateurs, évaluer la qualité des flux et enrichir des IOC pour des workflows STIX 2.1. Ce skill analyzing-threat-intelligence-feeds est conçu pour les opérations de renseignement sur les menaces et l’analyse de données, avec des conseils pratiques pour TAXII, MISP et les flux commerciaux.

Data Analysis

Favoris 0GitHub 0

azure-ai-textanalytics-py

par microsoft

azure-ai-textanalytics-py est un skill pour Azure AI Text Analytics en Python. Il aide pour l’analyse de sentiment, la reconnaissance d’entités, l’extraction de phrases clés, la détection de langue, la détection de PII et le NLP pour la santé. Utilisez-le si vous cherchez un moyen rapide de configurer un client Azure, de gérer l’authentification et d’exploiter concrètement l’analyse de texte dans des applications, des notebooks ou des flux d’analyse de données.

Data Analysis

Favoris 0GitHub 0

chdb-sql

par ClickHouse

chdb-sql est un skill GitHub pour exécuter du SQL ClickHouse dans Python, sans serveur. Il couvre `chdb.query()`, `Session`, les connexions DB-API, des fonctions de table comme `file()` et `s3()`, les requêtes paramétrées, ainsi que des workflows de développement backend pour les fichiers locaux et les sources de données externes.

Backend Development

Favoris 0GitHub 0