benchmark

von affaan-m

Nutze das benchmark-Skill, um Performance-Baselines zu messen, Regressionen vor und nach PRs zu erkennen und Stack-Alternativen über Seiten, APIs und Builds hinweg für Performance Optimization zu vergleichen.

Stars156.1k

Favoriten0

Kommentare0

Hinzugefügt15. Apr. 2026

KategoriePerformance Optimization

Installationsbefehl

npx skills add affaan-m/everything-claude-code --skill benchmark

Kurationswert

Dieses Skill erreicht 67/100 und ist damit grundsätzlich für das Verzeichnis geeignet, weist aber spürbare Lücken in der praktischen Umsetzung auf. Das Repository vermittelt ausreichend klar, wann Benchmarking sinnvoll ist und was über Seiten-, API- und Build-Performance gemessen werden sollte, sodass ein Agent es wahrscheinlich korrekt anstoßen kann. Nutzer sollten jedoch damit rechnen, eigene Tool-Auswahl, Befehle und den Reporting-Workflow selbst zu ergänzen, da das Skill eher einen Messrahmen als eine komplett lauffähige Anleitung bietet.

67/100

Stärken

Starke Triggerbarkeit: Der Abschnitt "When to Use" macht vor/nach PR-Checks, Baseline-Setup, Ursachenanalyse bei Verlangsamungen, Launch-Readiness und Stack-Vergleiche sehr deutlich.
Solide Benchmark-Abdeckung: Es werden konkrete Metriken für Seitenperformance, APIs sowie Build- und Dev-Loop-Performance beschrieben, einschließlich Core Web Vitals und Latenz-Perzentilen.
Hilfreiche Struktur für Agenten: Die nummerierten Messschritte und Zielschwellen geben mehr Orientierung als ein generischer Prompt zur Performance-Bewertung.

Hinweise

Die operative Klarheit ist begrenzt: Das Skill verweist auf browser MCP und Benchmarking-Modi, liefert aber weder einen Installationsbefehl noch Support-Dateien oder konkrete Befehlsbeispiele zum Ausführen der Tests.
Vertrauen und Tiefe der Einführung sind eher gering: Es fehlen Skripte, Referenzen, Ressourcen oder begleitende Assets, die einen reproduzierbaren Workflow oder Beispielausgaben zeigen.

Claude Code Metrics Performance Testing API Browser Automation

Überblick

Überblick über die Benchmark-Skill

Was die Benchmark-Skill macht

Die benchmark-Skill hilft Ihnen dabei, Leistungs-Baselines zu messen, Regressionen zu erkennen und Alternativen mit einem reproduzierbaren Workflow zu vergleichen, statt mit ad-hoc Prüfungen. Sie ist für benchmark for Performance Optimization über Webseiten, APIs, Build-Pipelines und Vorher/Nachher-Vergleiche hinweg ausgelegt.

Wer diese Benchmark-Skill installieren sollte

Diese Benchmark-Skill ist besonders geeignet für Engineers, Tech Leads und AI-unterstützte Entwickler, die belastbare Antworten auf Fragen wie „Ist das langsamer geworden?“ oder „Hat dieses PR die Performance verbessert?“ brauchen. Sie ist vor allem dann nützlich, wenn Sie vor dem Launch, nach Nutzerbeschwerden oder bei der Bewertung von Stack-Änderungen eine gemeinsame Messmethode benötigen.

Was sie gegenüber einem generischen Prompt nützlicher macht

Ein normaler Prompt würde einen Agenten vielleicht auffordern, „die Performance zu prüfen“. Diese Skill ist besser, weil sie einen konkreten Benchmark-Rahmen vorgibt: Seitenmetriken wie Core Web Vitals und Seitengewicht, API-Latenz-Perzentile und Concurrency-Checks sowie Metriken aus dem Dev-Loop wie Build- und Testzeiten. Diese Struktur reduziert Rätselraten und macht Ergebnisse über die Zeit leichter vergleichbar.

So verwenden Sie benchmark skill

Installationskontext und was Sie zuerst lesen sollten

Für benchmark install fügen Sie die Skill aus dem Repository hinzu, das skills/benchmark enthält, und öffnen dann zuerst SKILL.md. In diesem Fall ist die Skill in sich geschlossen, daher steckt der Großteil der nutzbaren Anleitung in dieser Datei. Lesen Sie sie in dieser Reihenfolge:

SKILL.md
den Abschnitt „When to Use“
den Modus, der zu Ihrer Aufgabe passt: Seite, API, Build oder Vorher/Nachher-Vergleich

Welche Eingaben die benchmark skill braucht

Gute Benchmark-Nutzung hängt davon ab, ein echtes Ziel und klare Erfolgskriterien zu liefern. Sinnvolle Eingaben sind:

Ziel-URLs oder API-Endpunkte
Umgebung: lokal, Staging, Preview, Produktion
Zu testende Änderung: Branch, PR, Commit oder Stack-Option
Erwartete Ziele: LCP, INP, p95-Latenz, Build-Zeit, Bundle-Größe
Testeinschränkungen: Auth, Seed-Daten, Region, Geräteannahmen

Eine schwache Anfrage ist: „Benchmark meine App.“
Eine stärkere Anfrage ist: „Nutze die benchmark skill für diese 3 Staging-URLs, erfasse LCP/CLS/INP, Seitengewicht und Request-Anzahl und vergleiche dann mit Produktion; markiere Regressionen über 10%.“

Aus einem groben Ziel einen starken Benchmark-Prompt machen

Verwenden Sie für den Benchmark-Leitfaden eine Prompt-Vorlage wie diese:

Scope: Seite, API, Build oder Vorher/Nachher
Targets: genaue URLs, Endpunkte, Befehle oder Branches
Metriken: was gemessen werden soll und welche Schwellen gelten
Vergleich: Baseline vs. Kandidat
Ausgabe: Übersichtstabelle, Regressionen, wahrscheinliche Ursachen, nächste Schritte

Beispiel:
„Nutze die benchmark skill, um diesen PR-Branch mit main zu vergleichen. Teste für die Seitenperformance /, /pricing und /checkout auf dem Preview-Deployment. Berichte LCP, FCP, CLS, INP, TTFB, gesamtes Seitengewicht, JS-Gewicht und Request-Anzahl. Hebe Regressionen über 5% hervor und schlage die drei wichtigsten Fixes vor.“

Praktischer Workflow, der die Ergebnisqualität verbessert

Ein ertragreicher benchmark usage-Workflow sieht so aus:

Zuerst nur einen Modus wählen.
Eine Baseline in einer stabilen Umgebung festlegen.
Den gleichen Benchmark auf der geänderten Version ausführen.
Eine Vergleichstabelle und eine Regressionszusammenfassung anfordern.
Erst danach Diagnose und Optimierungsideen abfragen.

Diese Reihenfolge ist wichtig. Wenn Sie die Baseline auslassen, kann der Agent plausible, aber wenig vertrauenswürdige Empfehlungen liefern. Wenn die Ergebnisse stark schwanken, den Scope auf weniger Ziele eingrenzen und unter kontrollierteren Bedingungen erneut messen.

benchmark skill FAQ

Ist diese benchmark skill für Seiten, APIs oder Builds gedacht?

Für alle drei. Die Skill deckt ausdrücklich Seitenperformance, API-Performance und Build-/Developer-Loop-Performance ab. Damit ist sie breiter als ein reiner Lighthouse-Workflow und praxisnäher, wenn Performance-Probleme Frontend, Backend und Tooling gleichzeitig betreffen.

Wann sollte ich benchmark statt eines normalen Performance-Prompts verwenden?

Nutzen Sie benchmark, wenn Sie reproduzierbare Messungen, Vorher/Nachher-Vergleiche oder Regressionserkennung brauchen. Ein generischer Prompt reicht für Brainstorming von Optimierungsideen aus, aber diese Skill ist besser, wenn die eigentliche Aufgabe Messen statt Meinung ist.

Ist die benchmark skill anfängerfreundlich?

Ja, sofern Sie klare Ziele angeben können. Sie müssen nicht jede Metrik im Voraus kennen, sollten aber wissen, was Sie benchmarken und wo. Einsteiger erzielen den größten Nutzen, wenn sie mit einer Seite oder einem Endpoint beginnen und erst erweitern, wenn der erste Lauf verständlich ist.

Wann ist das eine schlechte Passung?

Lassen Sie diese benchmark skill aus, wenn Sie nur allgemeine Performance-Bildung möchten und keine Messung. Sie ist auch eine schwache Wahl, wenn Ihre Umgebung zu instabil ist, um Läufe zu vergleichen, oder wenn Sie keine erreichbaren URLs, aufrufbaren Endpunkte oder ausführbaren Build-Kommandos bereitstellen können.

So verbessern Sie benchmark skill

Bessere Eingaben für bessere Benchmark-Ergebnisse

Die wichtigste Verbesserung ist die Qualität der Eingaben. Für benchmark for Performance Optimization sollten Sie angeben:

genaue Targets
Produktions- oder Staging-Umgebung
Baseline- und Kandidatenversion
Schwellenwerte, die für Ihr Team relevant sind
erforderliche Authentifizierung oder Setup-Schritte

„Benchmark unsere API“ ist zu vage.
„Benchmark POST /search und GET /products/:id auf Staging mit 100 Requests, 10 Concurrency und Bericht zu p50/p95/p99 im Vergleich zu unserem 300ms-p95-SLA“ ist umsetzbar.

Häufige Benchmark-Fehler vermeiden

Typische Probleme:

unterschiedliche Umgebungen vergleichen
mehrere Änderungen in einem Test vermischen
unrealistische Seiten oder Endpunkte verwenden
erst Diagnose verlangen, bevor gemessen wurde
keine akzeptablen Regression-Schwellen definieren

Solche Fehler machen Benchmark-Ausgaben verrauscht und schwer vertrauenswürdig. Erst das Setup kontrollieren, dann das Ergebnis interpretieren.

Vergleiche anfordern, nicht nur Einzelwerte

Ein einzelner Messpunkt ist weniger nützlich als eine relative Veränderung. Verbessern Sie die Ausgabe der benchmark skill, indem Sie Folgendes anfordern:

Tabellen mit Baseline vs. Kandidat
prozentuale Veränderung
bestanden/nicht bestanden gegen Schwellenwerte
vermutete Ursachen nur für die wichtigsten Regressionen

So wird der Agent von reiner Datenausgabe zu Entscheidungshilfe.

Nach dem ersten Benchmark-Lauf iterieren

Nach dem ersten Durchlauf den Scope enger ziehen. Bitten Sie den Agenten, nur die langsamsten Seiten, das schlechteste API-Perzentil oder den schwersten Build-Schritt erneut zu testen. Fordern Sie dann gezielte Folgefragen an, etwa „konzentriere dich auf render-blockierende Assets“ oder „untersuche, warum p99 deutlich schlechter ist als p50“. Genau in diesem iterativen Loop wird der benchmark guide am nützlichsten, weil er aus einem breiten Messdurchlauf einen praktischen Optimierungsplan macht.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

vercel-react-best-practices

von vercel-labs

vercel-react-best-practices ist ein Vercel-Engineering-Skill, der KI-Agenten mit priorisierten Regeln zu Waterfalls, Bundle-Größe und Rendering hilft, React- und Next.js-Performance zu optimieren.

Frontend Development

Favoriten 0GitHub 24k

performance-optimization

von addyosmani

Die performance-optimization Skill hilft dir, zuerst zu messen, den eigentlichen Engpass zu finden, ihn zu beheben und die Ergebnisse zu überprüfen. Nutze sie, wenn Leistungsanforderungen bestehen, du eine Regression vermutest oder Core Web Vitals, Ladezeiten oder Interaktionslatenz verbessert werden müssen.

Performance Optimization

Favoriten 0GitHub 18.7k

supabase-postgres-best-practices

von supabase

supabase-postgres-best-practices ist eine Skill für die Optimierung von Supabase Postgres – für Query-Tuning, Indexing, Schema-Design, RLS-Performance, Locking und Verbindungsmanagement.

Database Engineering

Favoriten 0GitHub 1.7k

wp-performance

von WordPress

Nutze wp-performance, um WordPress-Performance im Backend zu untersuchen und zu verbessern – ganz ohne Browser-UI. Es unterstützt eine messungsorientierte Diagnose langsamer Frontend-Requests, Admin-Seiten, REST-Routen und WP-Cron und bietet Anleitung zu WP-CLI profile/doctor, Query Monitor über REST-Header, Server-Timing, Datenbankabfragen, Autoload-Optionen, Object Caching, Cron und entfernten HTTP-Aufrufen.

Performance Optimization

Favoriten 0GitHub 1.4k

web-perf

von cloudflare

web-perf analysiert Web-Performance mit Chrome DevTools MCP. Es misst Core Web Vitals, ladebezogene Probleme anhand von Traces, renderblockierende Ressourcen, Layoutverschiebungen, Caching-Probleme und Lücken bei der Barrierefreiheit. Verwende das web-perf Skill für Performance-Optimierung, das Debugging langsamer Seiten und evidenzbasierte Web-Performance-Workflows, die auf aktuellen Docs und Live-Traces beruhen.

Performance Optimization

Favoriten 0GitHub 1.3k

react-native-best-practices

von callstackincubator

react-native-best-practices ist ein praxisnaher React-Native-Leitfaden zur Performance-Optimierung bei langsamem Start, ausgelassenen Frames, teuren Renderings, Memory Leaks, aufgeblähten Bundles und ruckeligen Animationen. Nutze ihn, wenn du belegbare Lösungen für Hermes, Bridge-Overhead, FlashList, native Module oder die Analyse einer Regression in einem Release brauchst.

Performance Optimization

Favoriten 0GitHub 1.3k

swift-nio

von Joannis

swift-nio ist eine Skill für die SwiftNIO-Backend-Entwicklung und deckt Server, Clients, Pipelines, Buffers, Codecs und event-loop-sicheren Async-Code ab. Verwenden Sie sie für Fragen zur Nutzung von swift-nio, zum Parsen von Protokollen, für TCP-/UDP-Dienste, die NIOAsyncChannel-Integration und zum Debuggen von blockierender Arbeit auf einem EventLoop. Es ist ein praxisnaher swift-nio-Leitfaden für die richtige Architektur und Implementierung.

Backend Development

Favoriten 0GitHub 0

audit-website

von squirrelscan

Die Skill audit-website nutzt die `squirrel` CLI, um Websites und Webapps anhand von über 230 Regeln in den Bereichen SEO, Technik, Inhalte, Performance, Sicherheit, Links und Site-Health zu prüfen und anschließend umsetzbare, LLM-taugliche Reports bereitzustellen.

UX Audit

Favoriten 0GitHub 68

autoresearch

von github

autoresearch ist ein autonomer Experimentierzyklus für Coding-Aufgaben mit messbaren Ergebnissen. Die Skill hilft Entwicklerinnen und Entwicklern dabei, Ziel, Ausgangsbasis, Metrik und Umfang festzulegen und anschließend über Codeänderungen, Tests sowie Behalten-oder-Zurücksetzen-Entscheidungen mit git-gestützten Checkpoints zu iterieren.

Workflow Automation

Favoriten 0GitHub 0

godot-gdscript-patterns

von wshobson

godot-gdscript-patterns unterstützt Nutzer von Godot 4 dabei, GDScript mit besserer Szenenstruktur, Signals, Zustandsmaschinen, Autoloads und Async-Loading-Mustern zu erstellen und zu prüfen. Ideal, um bewährte Godot-Architektur in Gameplay-Systeme, UI-Abläufe und wartbaren Projektcode zu übernehmen.

Frontend Development

Favoriten 0GitHub 32.5k

pytorch-patterns

von affaan-m

pytorch-patterns hilft dir, PyTorch-Code mit geräteunabhängigen Mustern, reproduzierbaren Experimenten und explizitem Tensor-Handling zu schreiben, zu prüfen und zu debuggen. Nutze den pytorch-patterns Skill für sauberere Training-Loops, Modell-Refactorings und praxisnahe PyTorch-Hinweise.

Code Editing

Favoriten 0GitHub 156.2k

nextjs-turbopack

von affaan-m

Das nextjs-turbopack Skill hilft dir, Turbopack in Next.js 16+ für schnellere lokale Entwicklung, HMR und Entscheidungen rund um den Bundler einzusetzen. Nutze es als praxisnahen nextjs-turbopack Leitfaden für Installation, Nutzung und die Frage, wann du in Frontend-Development-Workflows wieder zu webpack wechseln solltest.

Frontend Development

Favoriten 0GitHub 156.2k

jpa-patterns

von affaan-m

jpa-patterns ist ein praxisnaher Leitfaden zu JPA/Hibernate für die Spring-Boot-Backend-Entwicklung. Er behandelt Entity-Design, Beziehungen, Query-Tuning, Transaktionen, Auditing, Pagination und Pooling, um ORM-Fehler zu reduzieren und die Persistenzleistung zu verbessern.

Backend Development

Favoriten 0GitHub 156.2k

rust-async-patterns

von wshobson

rust-async-patterns ist ein praxisnaher Skill für asynchrones Rust mit Tokio und behandelt Tasks, Channels, Streams, Timeouts, Cancellation, Tracing und Error Handling für die Backend-Entwicklung.

Backend Development

Favoriten 0GitHub 32.6k

go-concurrency-patterns

von wshobson

go-concurrency-patterns unterstützt dich dabei, idiomatische Go-Concurrency für Worker-Pools, Pipelines, Channels, Sync-Primitiven und kontextbasierte Cancellation anzuwenden. Nutze die Hinweise aus SKILL.md, um sicherere Backend-Services zu entwerfen, Race Conditions zu debuggen und das Verhalten beim Graceful Shutdown zu verbessern.

Backend Development

Favoriten 0GitHub 32.6k

async-python-patterns

von wshobson

async-python-patterns ist ein praxisnaher Leitfaden zur Auswahl sicherer asyncio-Muster für I/O-lastige Python-Systeme. Er hilft dabei, den Installationskontext zu verstehen, den Einsatz zu prüfen, das Blockieren des Event Loops zu vermeiden und Async-APIs, Worker, Scraper und Backend-Services mit begrenzter Parallelität, Cancellation sowie den richtigen Sync-vs-Async-Abwägungen zu entwerfen.

Backend Development

Favoriten 0GitHub 32.6k