Data Processing

Data Processing taxonomy generated by the site skill importer.

17 Skills

regex-vs-llm-structured-text

von affaan-m

regex-vs-llm-structured-text Skill zur Auswahl von Regex oder LLM bei der Extraktion strukturierter Texte. Starte mit deterministischem Parsen, ergänze LLM-Validierung für grenzwertige Unsicherheitsfälle und nutze eine günstigere, zuverlässigere Pipeline für Dokumente, Formulare, Rechnungen und Datenanalysen.

Data Analysis

Favoriten 0GitHub 156.2k

college-football-data-automation

von ComposioHQ

college-football-data-automation hilft Agenten, College Football Data-Aufgaben über Rube MCP und Composio zu automatisieren. Der Guide erklärt die Setup-Anforderungen, Tool-Erkennung mit RUBE_SEARCH_TOOLS, Verbindungsprüfungen und praxistaugliche Nutzungsmuster.

Workflow Automation

Favoriten 0GitHub 67.5k

cloudconvert-automation

von ComposioHQ

cloudconvert-automation hilft Agents, CloudConvert-Formatkonvertierungen über Rube MCP auszuführen: zuerst werden Live-Tool-Schemas gesucht, die cloudconvert-Verbindung wird geprüft, und veraltete API-Felder werden vermieden.

Format Conversion

Favoriten 0GitHub 67.5k

omero-integration

von K-Dense-AI

Die omero-integration-Skill für OMERO-Python-Workflows in der Backend-Entwicklung. Verbinde dich mit OMERO, rufe Projekte, Datensätze, Bilder, ROIs, Anmerkungen und Tabellen ab und führe Batch-Skripte mit weniger Rätselraten aus.

Backend Development

Favoriten 0GitHub 21.3k

hypogenic

von K-Dense-AI

hypogenic ist ein Skill zum Generieren und Testen von Hypothesen auf tabellarischen oder aus Text abgeleiteten Datensätzen mit LLM-Unterstützung. Er unterstützt hypogenic für Data Analysis, indem er empirische Fragen in strukturierte, überprüfbare Workflows für Klasseninterpretation, Inhaltsanalyse und Täuschungserkennung übersetzt. Nutzen Sie ihn, wenn Sie evidenzgestützte Hypothesen brauchen und nicht nur Brainstorming.

Data Analysis

Favoriten 0GitHub 21.3k

dnanexus-integration

von K-Dense-AI

dnanexus-integration ist eine praxisnahe Fähigkeit für Genomik-Workflows in der DNAnexus-Cloud. Sie hilft beim Erstellen von Apps und Applets, beim Verwalten von Uploads und Downloads, beim Ausführen von Workflows und beim Automatisieren von Pipelines mit dxpy. Der Leitfaden zu dnanexus-integration unterstützt Backend-Entwicklungsaufgaben mit FASTQ-, BAM- und VCF-Dateien sowie plattformspezifische Konfiguration und Job-Ausführung.

Backend Development

Favoriten 0GitHub 21.3k

huggingface-datasets

von huggingface

Nutze die Skill "huggingface-datasets" für Workflows mit der Hugging Face Dataset Viewer API, um Datensätze zu validieren, Splits aufzulösen, Zeilen vorzuschauen und zu paginieren, Text zu durchsuchen, Filter anzuwenden sowie Parquet-Links oder Statistiken abzurufen. Ein praktischer huggingface-datasets Leitfaden für die schreibgeschützte Erkundung von Datensätzen.

Web Scraping

Favoriten 0GitHub 10.4k

Workspace Data Analyst

von VoltAgent

Workspace Data Analyst ist ein schlankes Skill für Datenanalyse in deinem Workspace. Es analysiert CSV-Dateien, prüft Header, fasst Summen, Durchschnittswerte und Ausreißer zusammen und liefert prägnante Hinweise für den nächsten Schritt. Das Workspace Data Analyst Skill eignet sich ideal für schnelle, dateibewusste Prüfungen vor einer tieferen Modellierung.

Data Analysis

Favoriten 0GitHub 8.5k

azure-storage-file-datalake-py

von microsoft

azure-storage-file-datalake-py ist das Python-Skill für Azure Data Lake Storage Gen2. Es hilft Backend-Entwicklern und Agents beim Installieren, Authentifizieren und Verwenden des Azure SDK für Aufgaben mit hierarchischem Dateisystem, etwa beim Auflisten, Hochladen, Herunterladen sowie Verwalten von Verzeichnissen und Dateien.

Backend Development

Favoriten 0GitHub 2.3k

azure-cosmos-py

von microsoft

Die azure-cosmos-py Skill hilft dir beim Installieren, Konfigurieren und Verwenden des Azure Cosmos DB Python SDK für NoSQL CRUD, Abfragen, Container-Setup, Partitionierung und Authentifizierung. Besonders nützlich ist sie für Database-Engineering-Workflows, bei denen Partition Keys und Abfragekosten eine Rolle spielen.

Database Engineering

Favoriten 0GitHub 2.2k

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

tinybird

von tinybirdco

Bewährte Tinybird-Praktiken für Projektdateien, SQL-Regeln, Optimierungsmuster und dateibasierte Workflows. Nutze diesen tinybird Skill für Backend Development, wenn du Hilfe mit Datasources, Pipes, Endpoints, Materialized Views und bereitstellungssicheren Empfehlungen brauchst, die auf den Repo-Regeln basieren.

Backend Development

Favoriten 0GitHub 16

pymatgen

von K-Dense-AI

pymatgen ist ein Python-Toolkit für Materialwissenschaften für Kristallstrukturen, Phasendiagramme, elektronische Struktur und Dateikonvertierung. Diese pymatgen-Skill hilft bei wissenschaftlichen Workflows mit CIF, POSCAR, VASP und Daten aus dem Materials Project.

Scientific

Favoriten 0GitHub 0

exploratory-data-analysis

von K-Dense-AI

Die exploratory-data-analysis-Skill verwandelt wissenschaftliche Dateien in formatbewusste EDA-Berichte. Sie erkennt den Dateityp, fasst Struktur und Qualität zusammen, extrahiert wichtige Metadaten und schlägt Folgeanalysen vor. Nutzen Sie sie für exploratory-data-analysis zur Datenanalyse in Chemie, Bioinformatik, Mikroskopie, Spektroskopie, Proteomik, Metabolomik und anderen wissenschaftlichen Dateiformaten.

Data Analysis

Favoriten 0GitHub 0

astropy

von K-Dense-AI

astropy ist ein Python-Toolkit für Astronomie- und Astrophysik-Workflows. Nutzen Sie diese astropy Skill für Himmelskoordinaten, Einheiten, FITS-Dateien, Zeitskalen, Tabellen, WCS, Kosmologie und astropy für die Datenanalyse. Es hilft bei praktischen Astronomieaufgaben wie Koordinatentransformationen, Einheitenumrechnung und Datenverarbeitung.

Data Analysis

Favoriten 0GitHub 0

aeon

von K-Dense-AI

aeon ist eine mit scikit-learn kompatible Python-Skill für Machine Learning mit Zeitreihen. Verwende sie für Klassifikation, Regression, Clustering, Forecasting, Anomalieerkennung, Segmentierung, Similarity Search und andere Workflows mit zeitlichen Daten. Sie eignet sich für univariate und multivariate Analysen, wenn du spezielle Verfahren brauchst, die über generisches tabellarisches ML hinausgehen.

Data Analysis

Favoriten 0GitHub 0

postgres

von sanjay3290

Die postgres-Skill ermöglicht dir, livee PostgreSQL-Datenbanken mit nur lesendem SQL zu prüfen. Nutze sie für Schema-Analyse, Tabellenprüfungen und SELECT-basierte Auswertungen über mehrere Verbindungen hinweg mit automatischer Auswahl auf Basis von Beschreibungen. Sie ist für Database-Engineering-Workflows entwickelt und blockiert aus Sicherheitsgründen Schreibzugriffe wie INSERT, UPDATE, DELETE und DROP.

Database Engineering

Favoriten 0GitHub 0