scanpy

von K-Dense-AI

scanpy-Skill für die Analyse von Single-Cell-RNA-seq-Daten in Python. Geeignet für QC, Normalisierung, PCA, UMAP/t-SNE, Clustering, Markergen-Analyse, Trajektorienanalyse und Plots in Publikationsqualität. Am besten für explorative scRNA-seq-Workflows rund um AnnData, mit klaren Hinweisen zur Nutzung von scanpy und zur Installation.

Stars0

Favoriten0

Kommentare0

Hinzugefügt14. Mai 2026

KategorieData Analysis

Installationsbefehl

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Kurationswert

Dieser Skill erreicht 78/100 und ist damit eine solide Option für das Verzeichnis, wenn Nutzer einen sofort einsetzbaren Scanpy-Workflow statt eines generischen Prompts suchen. Das Repository zeigt einen umfangreichen, nicht nur aus Platzhaltern bestehenden Single-Cell-RNA-seq-Skill mit klaren Anwendungsfällen, konkreten Workflow-Schritten und genug Struktur, damit ein Agent ihn gezielt auslösen und anwenden kann, ohne viel raten zu müssen.

78/100

Stärken

Klar auf gängige scRNA-seq-Aufgaben wie QC, Normalisierung, PCA/UMAP/t-SNE, Clustering, Marker-Gene und Trajektorienanalyse ausgerichtet.
Umfangreicher SKILL.md-Inhalt mit gültigem Frontmatter, langem Fließtext, vielen Überschriften und Code-Beispielen, die die praktische Nutzung unterstützen.
Enthält Nutzungsgrenzen und Hinweise zu verwandten Skills, sodass Agenten Scanpy für explorative Einzelzellanalysen wählen und Fragen zu Deep Learning oder speziellen AnnData-Themen anderweitig abgeben können.

Hinweise

Es gibt keinen Installationsbefehl, keine Support-Dateien und keine externen Verweise, daher hängt die Nutzung vor allem von den schriftlichen Skill-Anweisungen ab.
Das Repository wirkt rein dokumentationsbasiert; Nutzer sollten also Workflow-Hinweise erwarten, keine verpackte Automatisierung oder getesteten Skripte.

Scanpy Python Scientific Single Cell Bioinformatics Genomics Jupyter

Überblick

Überblick über die scanpy-Skill

Wofür scanpy gedacht ist

Die scanpy-Skill ist für die Analyse von Single-Cell-RNA-seq-Daten in Python gedacht: Qualitätskontrolle, Normalisierung, Feature-Selektion, PCA, UMAP/t-SNE, Clustering, Marker-Identifikation und explorative Analysen mit Trajektorie-Charakter. Sie ist am besten geeignet, wenn du bereits ein AnnData-Objekt hast oder eines erstellen kannst und einen praxisnahen scanpy-Leitfaden für Data Analysis suchst, nicht einen Deep-Learning-Workflow.

Für wen sie geeignet ist

Nutze die scanpy-Skill, wenn du mit scRNA-seq-Daten arbeitest, Roh-Counts in ein analysebereites Objekt überführst oder Abbildungen und Cluster-Annotationen für Interpretation oder Publikation vorbereitest. Sie passt zu Analysten, die einen standardisierten explorativen Pipeline-Ansatz wollen und wissen, dass sie scanpy-Installations- und Nutzungsschritte brauchen, nicht eine allgemeine Bioinformatik-Einführung.

Was sie unterscheidet

Dieses Repository stellt den üblichen Scanpy-Workflow in den Mittelpunkt statt einer breiten Theorieübersicht: Daten laden, vorverarbeiten, Embeddings erzeugen, clustern und visualisieren. Es zieht auch die Grenzen klarer: Wenn du tiefe generative Modelle brauchst, schau dir scvi-tools an; wenn dein Hauptproblem die AnnData-Struktur oder Dateiformate sind, ist anndata der bessere Einstieg.

Wie man die scanpy-Skill verwendet

Die Skill installieren und prüfen

Installiere die scanpy-Skill im üblichen Verzeichnis-Workflow und öffne dann vor dem Prompting die Skill-Datei:

npx skills add K-Dense-AI/claude-scientific-skills --skill scanpy

Lies nach der Installation zuerst scientific-skills/scanpy/SKILL.md und folge dann allen verlinkten Abschnitten in der Datei. Hier gibt es keine zusätzlichen Hilfsskripte oder Referenzordner, deshalb ist der Skill-Text selbst die wichtigste Quelle.

Dem Modell analysebereite Eingaben geben

Die stärksten scanpy-Prompts nennen explizit Datenform, Format und Ziel. Gib an, ob deine Eingabe .h5ad, 10X-Output oder eine Count-Matrix ist; wie viele Proben oder Batches du hast; ob du QC-Schwellen, Integration, Clustering oder Plotting brauchst; und welches Ergebnis du erwartest. Ein schwacher Prompt lautet „analysiere meine scRNA-seq-Daten“; ein besserer lautet „verwende scanpy, um zwei 10X-Datensätze zu laden, qualitativ schlechte Zellen zu filtern, zu normalisieren, PCA/UMAP zu berechnen, auf mehreren Auflösungen zu clustern und Marker-Gene für jeden Cluster zu identifizieren“.

Ein praktischen Workflow befolgen

Für die meisten Aufgaben gehst du in dieser Reihenfolge vor: Daten laden, obs/var prüfen, qualitativ schlechte Zellen und Gene filtern, normalisieren/log-transformieren, hochvariable Gene auswählen, skalieren und PCA ausführen, Nachbarschaftsgraphen aufbauen, UMAP berechnen, clustern und anschließend Marker ranken oder Gen-Sets visualisieren. Wenn du bereits verarbeitetes AnnData hast, sag das dazu; so wiederholt die Skill die Setup-Schritte nicht und bleibt auf die noch offenen Analyseentscheidungen fokussiert.

Die richtigen Teile zuerst lesen

Starte mit dem Anfang von SKILL.md und springe dann zu den Nutzungsabschnitten zu Setup, Laden, Vorverarbeitung, Plotting und Downstream-Analyse. Wenn das Repository bestimmte Eingabeformate oder Konventionen nennt, übernimm sie in deinem Prompt exakt. Ziel ist, das Rätselraten zu reduzieren, bevor das Modell Code oder Analyseschritte schreibt.

FAQ zur scanpy-Skill

Ist scanpy nur für scRNA-seq?

Ja, in erster Linie. Die scanpy-Skill ist auf Single-Cell-Transkriptomik-Workflows ausgerichtet, vor allem auf explorative Analysen von Genexpressionsmatrizen. Sie ist nicht die richtige Wahl für Bulk-RNA-seq oder für Modellierungsaufgaben, die besser mit spezialisierten Single-Cell-Deep-Learning-Tools gelöst werden.

Brauche ich die Skill überhaupt, wenn ich ein Modell schon prompten kann?

Wenn du den kompletten Workflow und die genauen Objekte bereits kennst, kann ein normaler Prompt ausreichen. Die scanpy-Skill ist nützlicher, wenn du einen konsistenten Analysepfad, weniger fehlende Schritte und bessere Standardwerte für QC, Vorverarbeitung, Clustering und Visualisierung möchtest.

Ist sie anfängerfreundlich?

Sie ist insofern anfängerfreundlich, als die Pipeline standardisiert ist und die Skill sich auf die praktische Nutzung von scanpy konzentriert. Trotzdem setzt sie voraus, dass du grundlegendes Python, Single-Cell-Konzepte und den Unterschied zwischen Roh-Counts, normalisierten Daten und annotierten Metadaten verstehst.

Wann sollte ich sie nicht verwenden?

Nutze scanpy nicht als Haupt-Skill, wenn dein Problem vor allem Dateikonvertierung, AnnData-Schema-Design oder der Aufbau neuronaler Modelle für Cell-State-Inferenz ist. In solchen Fällen liefert eine andere Skill oder ein anderes Tool bessere Ergebnisse, als scanpy zwanghaft auf jeden Teil des Workflows auszudehnen.

So verbessert man die scanpy-Skill

Die Eingaben nennen, die Entscheidungen verändern

Die größten Qualitätsgewinne entstehen, wenn du Datensatzgröße, Organismus, Plattform, Batch-Struktur und den Analyse-Stand angibst, auf dem du bereits bist. Für die scanpy-Nutzung solltest du außerdem erwähnen, ob es Hinweise auf ambient RNA gibt, ob Doublet-Filtering nötig ist oder ob du einen bekannten Satz Marker-Gene hast, weil diese Details QC und Interpretation beeinflussen.

Nach Ergebnissen fragen, nicht nur nach Schritten

Frag nicht einfach nach „scanpy analysis“, sondern nach einem konkreten Deliverable: einem Preprocessing-Notebook, einem Clustering-Workflow, einer Tabelle mit Marker-Genen oder einem Plot-Block mit UMAP- und Violin-Plots. Klare Zieloutputs helfen dem Modell, die richtige scanpy-Leitstruktur zu wählen und unnötige Grundlagen zu vermeiden, die du nicht brauchst.

Auf die typischen Fehlerquellen achten

Die häufigsten Fehler sind fehlender QC-Kontext, das Vermischen von rohen und normalisierten Layern, Clustering vor dem Prüfen von Nachbarschaftsgraphen und Skalierungsentscheidungen sowie Anfragen nach Ergebnissen ohne klar definierte biologische Fragestellung. Wenn der erste Entwurf zu allgemein ist, überarbeite ihn mit dem genauen Eingabeobjekt, den Variablennamen und der Entscheidung, die die Analyse unterstützen soll.

Mit jeweils einer Einschränkung iterieren

Verbessere die Ausgabe der scanpy-Skill nach dem ersten Entwurf, indem du jeweils eine Einschränkung ergänzt: „nur h5ad verwenden“, „keine Integration“, „Plots in Publikationsqualität erstellen“ oder „Batch-Labels in obs erhalten“. Das ist meist besser als eine pauschale Neufassung, weil der Workflow stabil bleibt, während du die Teile schärfst, die für deine scanpy-for-Data-Analysis-Aufgabe wirklich wichtig sind.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

chdb-datastore

von ClickHouse

chdb-datastore ist ein pandas-kompatibles Skill für schnelle Datenanalyse mit einer von ClickHouse gestützten DataStore-API. Es unterstützt Connectoren für Dateien, Datenbanken und Cloud-Dienste, Cross-Source-Joins und minimale Codeänderungen für pandas-ähnliche Workflows. Nutzen Sie diesen chdb-datastore-Leitfaden, wenn Sie eine Drop-in-Analyseschicht für größere Datensätze suchen.

Data Analysis

Favoriten 0GitHub 0

sympy

von K-Dense-AI

Nutze die sympy-Skill für exakte symbolische Mathematik in Python, einschließlich Algebra, Analysis, Matrizen, physikalischer Formeln, Zahlentheorie, Geometrie und Codegenerierung. Sie hilft dir, Ausdrücke exakt zu halten, die passenden SymPy-Module auszuwählen und typische Fehler durch zu viel Fließkommaarithmetik zu vermeiden. Besonders geeignet für alle, die einen praktischen sympy-Leitfaden für symbolische Workflows und sympy für Data Analysis suchen.

Data Analysis

Favoriten 0GitHub 21.4k

interpreting-culture-index

von trailofbits

interpreting-culture-index hilft dabei, Culture-Index-Umfragen, Profil-Exporte und verwandte Notizen zu Recruiting oder Coaching zu interpretieren. Nutzen Sie dieses interpreting-culture-index Skill für die Eignung für Rollen, Teamdynamiken, Burnout-Risiken, Kandidaten-Feedbackgespräche, Onboarding-Pläne und Konfliktmediation. Der Fokus liegt auf der relativen Auswertung von Pfeilen, dem Prüfen von Anti-Patterns und praxisnahen Ergebnissen für Datenanalyse und Entscheidungsunterstützung.

Data Analysis

Favoriten 0GitHub 5k

azure-search-documents-py

von microsoft

azure-search-documents-py ist der Python-Skill für Azure AI Search im Backend-Umfeld und deckt Installation, Authentifizierung, Indexdesign, Vektorsuche, hybride Suche, semantisches Ranking und agentisches Retrieval ab. Nutzen Sie den azure-search-documents-py Skill, wenn Sie praxisnahe Orientierung vom Setup bis zu funktionierenden Query-Mustern benötigen.

Backend Development

Favoriten 0GitHub 2.3k

gget

von K-Dense-AI

gget ist eine Bioinformatik-Skill für den schnellen, einheitlichen Zugriff auf mehr als 20 genomische Datenbanken und Analysewerkzeuge über CLI oder Python. Nutzen Sie ihn für Geninformationen, BLAST-nahe Abfragen, AlphaFold-Strukturen, Expressionsdaten, Krankheitsassoziationen und Analysen im Stil von Enrichment-Workflows. Er eignet sich für schnelle Exploration und für gget in Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 0

torch-geometric

von K-Dense-AI

torch-geometric Skill-Guide für PyTorch Geometric Graph Neural Networks. Nutzen Sie ihn für Hilfe bei der Installation von torch-geometric, zur Anwendung von torch-geometric, für Graphklassifikation, Node-Klassifikation, Link Prediction, heterogene Graphen, benutzerdefinierte MessagePassing-Layer und das Skalieren von GNNs in Machine-Learning-Workflows.

Machine Learning

Favoriten 0GitHub 21.4k

rdkit

von K-Dense-AI

Die rdkit-Skill unterstützt präzise Cheminformatik-Workflows: SMILES, SDF, MOL, PDB und InChI parsen, Deskriptoren berechnen, Fingerprints erzeugen, Substruktursuche ausführen, Reaktionen handhaben und 2D-/3D-Koordinaten erstellen. Verwenden Sie diesen rdkit-Leitfaden für erweiterte Kontrolle, benutzerdefinierte Sanitization und rdkit für Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 21.4k

huggingface-vision-trainer

von huggingface

huggingface-vision-trainer hilft dir bei der Installation und Nutzung eines Hugging Face Skills für Vision-Trainingsjobs: Objekterkennung, Bildklassifikation und SAM/SAM2-Segmentierung. Abgedeckt werden Dataset-Vorbereitung, Cloud-GPU-Setup, Evaluation, Trackio-Logging und das Hochladen der Ergebnisse zum Hub. Ideal für Backend-Automatisierung und wiederholbare Trainings-Workflows.

Backend Development

Favoriten 0GitHub 10.4k

seo-dataforseo

von AgriciDaniel

seo-dataforseo verbindet Claude über den DataForSEO MCP-Server mit Live-SEO-Daten für SERP-Checks, Keyword-Recherche, Backlinks, Onpage-Analyse, Wettbewerbsrecherche, Business-Listings und AI-Visibility-Tracking. Am besten geeignet für datenbasierte Workflows, wenn Sie echte Suchbelege, klare Installationshinweise und praxisnahe Nutzung von seo-dataforseo brauchen.

Keyword Research

Favoriten 0GitHub 6.2k

pymc

von K-Dense-AI

PyMC ist ein Skill für Bayes-Modellierung zum Erstellen, Anpassen, Prüfen und Vergleichen probabilistischer Modelle in Python. Verwenden Sie pymc für hierarchische Regression, Mehrebenenanalyse, Zeitreihen, fehlende Daten, Messfehler und Modellvergleich mit LOO oder WAIC.

Data Analysis

Favoriten 0GitHub 0

pymatgen

von K-Dense-AI

pymatgen ist ein Python-Toolkit für Materialwissenschaften für Kristallstrukturen, Phasendiagramme, elektronische Struktur und Dateikonvertierung. Diese pymatgen-Skill hilft bei wissenschaftlichen Workflows mit CIF, POSCAR, VASP und Daten aus dem Materials Project.

Scientific

Favoriten 0GitHub 0

geopandas

von K-Dense-AI

geopandas-Skill für die georäumliche Analyse von Vektordaten in Python, inklusive Shapefiles, GeoJSON- und GeoPackage-Dateien. Damit können Sie räumliche Daten lesen, bereinigen, zusammenführen, puffern, zuschneiden, reprojizieren und exportieren – mit weniger Rätselraten.

Data Analysis

Favoriten 0GitHub 0

analyzing-threat-intelligence-feeds

von mukul975

analyzing-threat-intelligence-feeds hilft dir dabei, CTI-Feeds einzulesen, Indicators zu normalisieren, die Feed-Qualität zu bewerten und IOCs für STIX 2.1-Workflows anzureichern. Dieses analyzing-threat-intelligence-feeds Skill ist für Threat-Intelligence-Operations und Data Analysis ausgelegt und bietet praxisnahe Hinweise für TAXII, MISP und kommerzielle Feeds.

Data Analysis

Favoriten 0GitHub 0

azure-ai-textanalytics-py

von microsoft

azure-ai-textanalytics-py ist ein Skill für Azure AI Text Analytics in Python. Er hilft bei Sentimentanalyse, Entitätserkennung, Extraktion von Schlüsselphrasen, Spracherkennung, PII-Erkennung und Healthcare-NLP. Nutzen Sie ihn, wenn Sie einen schnellen Weg zur Einrichtung des Azure-Clients, zur Authentifizierung und zur praxisnahen Nutzung von Text Analytics für Apps, Notebooks oder Data-Analysis-Workflows brauchen.

Data Analysis

Favoriten 0GitHub 0

chdb-sql

von ClickHouse

chdb-sql ist ein GitHub-Skill, mit dem sich ClickHouse SQL in Python ohne Server ausführen lässt. Abgedeckt werden chdb.query(), Session, DB-API-Verbindungen, Table Functions wie file() und s3(), parametrische Abfragen sowie Entwicklungs-Workflows für lokale Dateien und externe Datenquellen.

Backend Development

Favoriten 0GitHub 0