pydeseq2

von K-Dense-AI

pydeseq2 ist ein Python-DESeq2-Skill für die Differential-Expressionsanalyse von Bulk-RNA-seq-Daten. Verwenden Sie ihn, um Bedingungen zu vergleichen, Einzel- oder Mehrfaktor-Designs zu modellieren, Wald-Tests und FDR-Korrekturen anzuwenden sowie Volcano- oder MA-Plots in pandas- und AnnData-Workflows zu erstellen.

Stars0

Favoriten0

Kommentare0

Hinzugefügt14. Mai 2026

KategorieData Analysis

Installationsbefehl

npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Kurationswert

Dieser Skill erreicht 80/100 und lohnt sich für die Aufnahme. Das Repository liefert Directory-Nutzern ausreichend Anhaltspunkte dafür, dass ein Agent erkennt, wann der Skill passt, einen realen PyDESeq2-Workflow zur differentiellen Genexpressionsanalyse nachvollzieht und ihn gezielter einsetzt als mit einem generischen Prompt. Er ist nicht perfekt verpackt, bietet aber viel operative Substanz und einen klaren Installationsnutzen für Anwender von Bulk-RNA-seq-Analysen.

80/100

Stärken

Starke Auslöserkennung: Frontmatter und „When to Use This Skill“ richten sich explizit an DESeq2, differentielle Expression, Bulk-RNA-seq-Counts und PyDESeq2.
Operativer Workflow-Inhalt: Der Skill enthält einen konkreten Quickstart mit pandas, DeseqDataSet, DeseqStats, Filterung, Wald-Tests und FDR-Korrektur.
Gute Hebelwirkung für Agenten: Er deckt Single- und Multi-Faktor-Designs, Batch-/Kovariatenbehandlung, apeGLM-Shrinkage sowie die Integration mit pandas und AnnData ab.

Hinweise

Es gibt keinen Installationsbefehl und keine Support-Dateien, daher müssen Nutzer Einrichtungs- und Umgebungsdetails möglicherweise selbst erschließen.
Das Repository ist mit einem Experimental-/Test-Signal markiert und scheint aus einer einzelnen SKILL.md ohne Referenzen oder Zusatz-Assets zu bestehen.

Python Pandas Bioinformatics Genomics Dataset

Überblick

Übersicht über den pydeseq2-Skill

Wofür pydeseq2 gedacht ist

pydeseq2 ist ein Python-Skill für die Differenzialanalyse der Genexpression auf Basis von Count-Daten aus Bulk-RNA-seq. Damit kommen Sie von Rohcounts und Sample-Metadaten zu DE-Ergebnissen, Fold Changes, adjustierten p-Werten und üblichen Explorationsausgaben wie Volcano- und MA-Plots.

Wer pydeseq2 verwenden sollte

Nutzen Sie den pydeseq2-Skill, wenn Sie eine DESeq2-ähnliche Analyse in Python durchführen möchten, Multi-Faktor-Designs brauchen oder Differential Expression in einen Workflow auf Basis von pandas oder AnnData einbetten wollen. Er passt gut für Analysten, die bereits Count-Matrizen und klinische oder experimentelle Metadaten vorliegen haben, nicht aber für Nutzer, die eine vollständige RNA-seq-Preprocessing-Pipeline suchen.

Warum pydeseq2 nützlich ist

Der größte Vorteil von pydeseq2 besteht darin, dass es die Hürde für Python-Nutzer senkt, die sonst für DESeq2 nach R wechseln müssten. Es unterstützt den Wald-Test, Korrektur für multiples Testen, optionales apeGLM-Shrinking und einen Workflow, der sich gut für reproduzierbare Notebooks oder Pipelines eignet.

So verwenden Sie den pydeseq2-Skill

pydeseq2 installieren

Installieren Sie den Skill in Ihrem Claude-Skill-Set und öffnen Sie dann die Skill-Dateien, bevor Sie mit dem Prompting beginnen:
npx skills add K-Dense-AI/claude-scientific-skills --skill pydeseq2

Prüfen Sie für Installations- und Setup-Entscheidungen bei pydeseq2, ob Ihre Umgebung bereits die RNA-seq-Count-Tabelle, Sample-Metadaten und die für Ihren Workflow nötigen Python-Pakete enthält. Der Skill ist am nützlichsten, wenn Sie Counts pro Sample und Gen sowie eine Designformel oder Gruppierungsvariable bereitstellen können.

Mit den richtigen Eingaben starten

Eine starke pydeseq2-Nutzung beginnt mit einer sauberen Eingabestruktur:

eine Count-Matrix mit Samples als Zeilen und Genen als Spalten
Metadaten, indiziert nach Sample-ID
eine klare Spaltenvariable für den Zustand sowie ggf. Batch- oder Kovariaten-Spalten für das Modell
ein explizites Vergleichsziel, etwa treated vs control

Ein schwacher Prompt sagt: „Führe eine Differenzialanalyse auf meinen RNA-seq-Daten aus.“
Ein stärkerer Prompt sagt: „Verwende pydeseq2 auf einer Bulk-RNA-seq-Count-Matrix mit 24 Samples, vergleiche treated vs control, nimm batch als Kovariate auf, filtere Gene mit sehr niedrigen Counts heraus und gib signifikante Gene plus Code für Volcano- und MA-Plots zurück.“

Diese Dateien zuerst lesen

Beginnen Sie mit SKILL.md, um den Workflow und die erwarteten Analyseschritte zu verstehen. Prüfen Sie dann README.md, AGENTS.md, metadata.json sowie vorhandene Ordner wie rules/, resources/, references/ oder scripts/. Für dieses Repository liegt das wichtigste praktische Signal in SKILL.md; gehen Sie daher nicht davon aus, dass zusätzliche Hilfsdateien vorhanden sind.

pydeseq2 richtig einsetzen

Behandeln Sie pydeseq2 als Analysemethode, nicht nur als Code-Generator. Sagen Sie dem Modell:

welches Organismus- und Assay-Setup Sie haben
wie die Samples gruppiert sind
ob Sie ein Ein-Faktor- oder Multi-Faktor-Design brauchen
ob Shrinkage, Ranking oder Visualisierung gewünscht ist
welches Ausgabeformat Sie benötigen, etwa ein DataFrame, Notebook-Zellen oder ein wiederverwendbares Skript

Das verbessert die Nutzung von pydeseq2, weil das Modell passende Design-, Filter- und Interpretationsschritte wählen kann, statt zu raten.

pydeseq2-Skill FAQ

Ist pydeseq2 nur für DESeq2-Nutzer gedacht?

Nein. Er ist für alle gedacht, die eine DESeq2-ähnliche Differenzialanalyse in Python möchten. Besonders nützlich ist er, wenn Sie ohnehin mit pandas, scanpy oder AnnData arbeiten und die Analyse in einem Stack halten wollen.

Brauche ich einen perfekten Prompt, um ihn zu nutzen?

Nein, aber vage Prompts führen zu generischem Analysecode. Der pydeseq2-Skill funktioniert am besten, wenn Sie die Form der Count-Tabelle, den interessierenden Vergleich und bekannte Störfaktoren angeben.

Ist pydeseq2 anfängerfreundlich?

Ja, wenn Sie die Grundlagen von RNA-seq-Counts und experimentellem Design bereits verstehen. Weniger geeignet ist er, wenn Sie Hilfe bei Alignment, Quantifizierung oder vorgelagertem QC vor der Differenzialanalyse brauchen.

Wann sollte ich pydeseq2 nicht verwenden?

Verwenden Sie ihn nicht für Single-Cell-Differenzialanalysen, normalisierte Expression ohne Rohcounts oder Workflows, die eine vollständige End-to-End-Transkriptomik-Pipeline erfordern. Er ist auch nicht die richtige Wahl, wenn Sie vor allem statistische Interpretation ohne Gen-Level-Count-Daten benötigen.

So verbessern Sie den pydeseq2-Skill

Mehr biologischen Kontext mitgeben

Die besten pydeseq2-Ergebnisse entstehen durch Prompts, die das Studiendesign erklären und nicht nur Dateinamen nennen. Nennen Sie die Zielvariable, die Kontrollbedingung, Batch-Effekte, die Zahl der Replikate und ob Sie Gen-Ranking, Plot-Code oder Interpretation wünschen.

Die wichtigen Analyseentscheidungen benennen

Sagen Sie dem Skill, wie mit Genen mit niedrigen Counts umgegangen werden soll, ob ein Multi-Faktor-Modell verwendet werden soll und ob Sie Shrinkage für Effektgrößen brauchen. Diese Entscheidungen wirken sich spürbar auf die pydeseq2-Ausgaben aus und helfen, generische Defaults zu vermeiden, die möglicherweise nicht zu Ihrer Studie passen.

Ausgabe anfordern, die Sie weiterverwenden können

Bitten Sie nicht nur um „Ergebnisse“, sondern um ein wiederverwendbares DataFrame-Schema, einen Plotting-Snippet oder einen Workflow, der direkt in ein Notebook passt. Zum Beispiel: „Gib pydeseq2-Code zurück, der das Modell fitten, adjustierte p-Werte extrahieren und eine CSV mit signifikanten Genen samt log2 fold change und padj schreiben kann.“

Von Diagnostik aus iterieren, nicht nur von den Endtreffern

Wenn der erste Lauf unplausibel aussieht, bitten Sie um QC-orientierte Prüfungen: Sample-Clustering, Begründung für das Count-Filtering, die Zahl der behaltenen Gene oder ob die Designformel durch Confounding verzerrt ist. Das ist der schnellste Weg, pydeseq2 für Data Analysis zu verbessern, wenn die Ergebnisse schwach oder unerwartet spärlich ausfallen.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

chdb-datastore

von ClickHouse

chdb-datastore ist ein pandas-kompatibles Skill für schnelle Datenanalyse mit einer von ClickHouse gestützten DataStore-API. Es unterstützt Connectoren für Dateien, Datenbanken und Cloud-Dienste, Cross-Source-Joins und minimale Codeänderungen für pandas-ähnliche Workflows. Nutzen Sie diesen chdb-datastore-Leitfaden, wenn Sie eine Drop-in-Analyseschicht für größere Datensätze suchen.

Data Analysis

Favoriten 0GitHub 0

sympy

von K-Dense-AI

Nutze die sympy-Skill für exakte symbolische Mathematik in Python, einschließlich Algebra, Analysis, Matrizen, physikalischer Formeln, Zahlentheorie, Geometrie und Codegenerierung. Sie hilft dir, Ausdrücke exakt zu halten, die passenden SymPy-Module auszuwählen und typische Fehler durch zu viel Fließkommaarithmetik zu vermeiden. Besonders geeignet für alle, die einen praktischen sympy-Leitfaden für symbolische Workflows und sympy für Data Analysis suchen.

Data Analysis

Favoriten 0GitHub 21.4k

interpreting-culture-index

von trailofbits

interpreting-culture-index hilft dabei, Culture-Index-Umfragen, Profil-Exporte und verwandte Notizen zu Recruiting oder Coaching zu interpretieren. Nutzen Sie dieses interpreting-culture-index Skill für die Eignung für Rollen, Teamdynamiken, Burnout-Risiken, Kandidaten-Feedbackgespräche, Onboarding-Pläne und Konfliktmediation. Der Fokus liegt auf der relativen Auswertung von Pfeilen, dem Prüfen von Anti-Patterns und praxisnahen Ergebnissen für Datenanalyse und Entscheidungsunterstützung.

Data Analysis

Favoriten 0GitHub 5k

azure-search-documents-py

von microsoft

azure-search-documents-py ist der Python-Skill für Azure AI Search im Backend-Umfeld und deckt Installation, Authentifizierung, Indexdesign, Vektorsuche, hybride Suche, semantisches Ranking und agentisches Retrieval ab. Nutzen Sie den azure-search-documents-py Skill, wenn Sie praxisnahe Orientierung vom Setup bis zu funktionierenden Query-Mustern benötigen.

Backend Development

Favoriten 0GitHub 2.3k

gget

von K-Dense-AI

gget ist eine Bioinformatik-Skill für den schnellen, einheitlichen Zugriff auf mehr als 20 genomische Datenbanken und Analysewerkzeuge über CLI oder Python. Nutzen Sie ihn für Geninformationen, BLAST-nahe Abfragen, AlphaFold-Strukturen, Expressionsdaten, Krankheitsassoziationen und Analysen im Stil von Enrichment-Workflows. Er eignet sich für schnelle Exploration und für gget in Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 0

torch-geometric

von K-Dense-AI

torch-geometric Skill-Guide für PyTorch Geometric Graph Neural Networks. Nutzen Sie ihn für Hilfe bei der Installation von torch-geometric, zur Anwendung von torch-geometric, für Graphklassifikation, Node-Klassifikation, Link Prediction, heterogene Graphen, benutzerdefinierte MessagePassing-Layer und das Skalieren von GNNs in Machine-Learning-Workflows.

Machine Learning

Favoriten 0GitHub 21.4k

rdkit

von K-Dense-AI

Die rdkit-Skill unterstützt präzise Cheminformatik-Workflows: SMILES, SDF, MOL, PDB und InChI parsen, Deskriptoren berechnen, Fingerprints erzeugen, Substruktursuche ausführen, Reaktionen handhaben und 2D-/3D-Koordinaten erstellen. Verwenden Sie diesen rdkit-Leitfaden für erweiterte Kontrolle, benutzerdefinierte Sanitization und rdkit für Data-Analysis-Workflows.

Data Analysis

Favoriten 0GitHub 21.4k

huggingface-vision-trainer

von huggingface

huggingface-vision-trainer hilft dir bei der Installation und Nutzung eines Hugging Face Skills für Vision-Trainingsjobs: Objekterkennung, Bildklassifikation und SAM/SAM2-Segmentierung. Abgedeckt werden Dataset-Vorbereitung, Cloud-GPU-Setup, Evaluation, Trackio-Logging und das Hochladen der Ergebnisse zum Hub. Ideal für Backend-Automatisierung und wiederholbare Trainings-Workflows.

Backend Development

Favoriten 0GitHub 10.4k

seo-dataforseo

von AgriciDaniel

seo-dataforseo verbindet Claude über den DataForSEO MCP-Server mit Live-SEO-Daten für SERP-Checks, Keyword-Recherche, Backlinks, Onpage-Analyse, Wettbewerbsrecherche, Business-Listings und AI-Visibility-Tracking. Am besten geeignet für datenbasierte Workflows, wenn Sie echte Suchbelege, klare Installationshinweise und praxisnahe Nutzung von seo-dataforseo brauchen.

Keyword Research

Favoriten 0GitHub 6.2k

pymc

von K-Dense-AI

PyMC ist ein Skill für Bayes-Modellierung zum Erstellen, Anpassen, Prüfen und Vergleichen probabilistischer Modelle in Python. Verwenden Sie pymc für hierarchische Regression, Mehrebenenanalyse, Zeitreihen, fehlende Daten, Messfehler und Modellvergleich mit LOO oder WAIC.

Data Analysis

Favoriten 0GitHub 0

pymatgen

von K-Dense-AI

pymatgen ist ein Python-Toolkit für Materialwissenschaften für Kristallstrukturen, Phasendiagramme, elektronische Struktur und Dateikonvertierung. Diese pymatgen-Skill hilft bei wissenschaftlichen Workflows mit CIF, POSCAR, VASP und Daten aus dem Materials Project.

Scientific

Favoriten 0GitHub 0

geopandas

von K-Dense-AI

geopandas-Skill für die georäumliche Analyse von Vektordaten in Python, inklusive Shapefiles, GeoJSON- und GeoPackage-Dateien. Damit können Sie räumliche Daten lesen, bereinigen, zusammenführen, puffern, zuschneiden, reprojizieren und exportieren – mit weniger Rätselraten.

Data Analysis

Favoriten 0GitHub 0

analyzing-threat-intelligence-feeds

von mukul975

analyzing-threat-intelligence-feeds hilft dir dabei, CTI-Feeds einzulesen, Indicators zu normalisieren, die Feed-Qualität zu bewerten und IOCs für STIX 2.1-Workflows anzureichern. Dieses analyzing-threat-intelligence-feeds Skill ist für Threat-Intelligence-Operations und Data Analysis ausgelegt und bietet praxisnahe Hinweise für TAXII, MISP und kommerzielle Feeds.

Data Analysis

Favoriten 0GitHub 0

azure-ai-textanalytics-py

von microsoft

azure-ai-textanalytics-py ist ein Skill für Azure AI Text Analytics in Python. Er hilft bei Sentimentanalyse, Entitätserkennung, Extraktion von Schlüsselphrasen, Spracherkennung, PII-Erkennung und Healthcare-NLP. Nutzen Sie ihn, wenn Sie einen schnellen Weg zur Einrichtung des Azure-Clients, zur Authentifizierung und zur praxisnahen Nutzung von Text Analytics für Apps, Notebooks oder Data-Analysis-Workflows brauchen.

Data Analysis

Favoriten 0GitHub 0

chdb-sql

von ClickHouse

chdb-sql ist ein GitHub-Skill, mit dem sich ClickHouse SQL in Python ohne Server ausführen lässt. Abgedeckt werden chdb.query(), Session, DB-API-Verbindungen, Table Functions wie file() und s3(), parametrische Abfragen sowie Entwicklungs-Workflows für lokale Dateien und externe Datenquellen.

Backend Development

Favoriten 0GitHub 0