create-skill-test

von dotnet

create-skill-test erstellt Gerüstdateien vom Typ `eval.yaml` für Agent-Skills in `dotnet/skills`. Verwende es, um Skill-Tests anzulegen, Szenarien, Fixtures, Assertions und Rubrics zu definieren und Overfitting im Evaluationsdesign zu reduzieren. Es ist nicht dafür gedacht, vorhandene Tests auszuführen, Validator-Fehler zu debuggen oder `SKILL.md`-Dateien zu erstellen.

Stars3k

Favoriten0

Kommentare0

Hinzugefügt25. Mai 2026

KategorieSkill Testing

Installationsbefehl

npx skills add dotnet/skills --skill create-skill-test

Kurationswert

Dieser Skill erreicht 62/100 und ist damit grundsätzlich listbar, sollte aber mit Vorsicht betrachtet werden: Er bietet eine echte, zielgerichtete Arbeitsweise zum Gerüstanlegen von `eval.yaml`-Testdateien, ist jedoch enger gefasst und stärker repository-spezifisch als ein breit wiederverwendbarer Skill.

62/100

Stärken

Klarer Auslöser: Die Frontmatter sagt ausdrücklich, dass er zum Erstellen von `eval.yaml`-Testdateien, zum Hinzufügen von Szenarien, zum Einrichten von Fixtures und zum Prüfen von Overfitting-Risiken verwendet werden soll.
Praktisch konkreter Ablauf: Der Text enthält explizite Eingaben, Hinweise dazu, wann der Skill zu verwenden ist und wann nicht, sowie einen mehrstufigen Prozess mit Vorgaben.
Hoher Nutzen für die Installationsentscheidung bei Mitwirkenden an `dotnet/skills`: Er verweist auf Validator-Prüfungen und Repository-Konventionen und reduziert so die Unsicherheit gegenüber einem generischen Prompt.

Hinweise

Er ist experimentell bzw. testorientiert und an die Konventionen von `dotnet/skills` gebunden, daher lässt er sich außerhalb dieses Repositories möglicherweise nur begrenzt übertragen.
Es sind keine Skripte, Referenzen oder Support-Dateien enthalten, daher müssen Nutzer die Implementierungsdetails allein aus dem Dokument ableiten.

Test Template Docs Developer Audience Dotnet

Überblick

Überblick über die Skill `create-skill-test`

create-skill-test ist ein Scaffold- und Validierungshelfer zum Erstellen von eval.yaml-Testdateien für Agent-Skills im Repository dotnet/skills. Er richtet sich an Personen, die einen verlässlichen Ausgangspunkt für Skill-Tests brauchen, nicht an einen allgemeinen Prompt für „schreib einen Test“. Die Hauptaufgabe besteht darin, aus einem Ziel-Skill, einem Plugin-Namen und einer Szenario-Idee eine conventionsichere Teststruktur mit Fixtures, Assertions und Rubrics zu machen, die weniger leicht auf ein einzelnes Ergebnis überangepasst ist.

Die Skill create-skill-test eignet sich am besten für Autorinnen und Autoren, die bereits wissen, welchen Skill sie evaluieren wollen, und schnell eine Testdatei erzeugen müssen, die zu den Repository-Regeln passt. Weniger nützlich ist sie, wenn Sie nur Tests ausführen, Validator-Fehler debuggen oder Skill-Anweisungen von Grund auf schreiben möchten.

Wofür `create-skill-test` gedacht ist

Nutzen Sie die Skill create-skill-test, wenn Sie eine neue Eval-Datei anlegen, eine bestehende um weitere Szenarien erweitern oder prüfen möchten, ob Ihre Rubrik zu stark auf eine ganz bestimmte Ausgabe zugeschnitten ist. Besonders hilfreich ist sie für Workflows vom Typ create-skill-test for Skill Testing, bei denen die Qualität des Testdesigns genauso wichtig ist wie die YAML-Form.

Wobei sie hilft, Fehler zu vermeiden

Der größte Nutzen liegt darin, fragile Evals zu vermeiden: fehlende Pflichtfelder, nicht passende Skill-Pfade, schlechte Fixture-Organisation und Rubrik-Formulierungen, die versehentlich eine bestimmte Wortwahl belohnen statt das eigentliche Verhalten. Das ist wichtig, wenn Tests auch dann noch brauchbar bleiben sollen, wenn sich der Ziel-Skill weiterentwickelt.

Was sie nicht ersetzt

Sie ersetzt weder den Skill-Validator noch hilft sie beim Bearbeiten von SKILL.md-Dateien. Wenn Ihr Ziel ist, einen fehlerhaften Testlauf zu analysieren oder Validator-Ausgaben zu debuggen, ist das hier das falsche Werkzeug.

So verwenden Sie die Skill `create-skill-test`

Installation und die Quelldatei öffnen

Installieren Sie create-skill-test mit npx skills add dotnet/skills --skill create-skill-test. Lesen Sie dann zuerst SKILL.md, denn dort stehen der Workflow, die Eingabeanforderungen und die Grenzen, die festlegen, ob Ihre Anfrage überhaupt gültig ist, bevor Sie das Modell etwas generieren lassen.

Geben Sie der Skill den richtigen Testauftrag

Eine gute Anfrage für create-skill-test install lautet nicht einfach „mach einen Test“. Nennen Sie den Skill-Namen, den Plugin-Namen, das Verhalten, das geprüft werden soll, und alle relevanten Szenarioeinschränkungen. Die Skill erwartet Eingaben wie den Ziel-Skill unter plugins/<plugin>/skills/, deshalb ist präzise Benennung entscheidend.

Ein besserer Auftrag sieht so aus:

Skill: foo-bar
Plugin: dotnet-msbuild
Ziel: prüfen, dass der Agent eine gültige Zusammenfassung erstellt und nicht unterstützte Pfade ablehnt
Szenario: Erstnutzer mit Teilkontext
Fixture-Bedarf: eine minimale Eingabedatei und eine Datei für einen Grenzfall

Das gibt dem create-skill-test usage-Ablauf genug Struktur, um einen nützlichen Eval statt eines generischen zu erzeugen.

Lesen Sie die relevanten Repository-Bereiche

Beginnen Sie mit SKILL.md und prüfen Sie dann gegebenenfalls auch README.md, AGENTS.md, metadata.json sowie nahegelegene Ordner wie rules/, resources/, references/ oder scripts/, falls sie vorhanden sind. In diesem Repository-Snapshot ist nur SKILL.md sichtbar, daher ist die Skill-Definition selbst die wichtigste Quelle der Wahrheit.

Szenarien und Rubrics iterativ verbessern

Nutzen Sie den ersten Entwurf, um zu prüfen, ob der Test tatsächlich das gewünschte Verhalten misst. Wenn die Rubrik Formulierungen statt Ergebnisse belohnt, schärfen Sie sie nach. Wenn das Szenario zu breit ist, teilen Sie es auf. Wenn der Skill nur einen Happy Path braucht, halten Sie den Eval klein, statt zusätzliche Fälle zu erfinden.

FAQ zur Skill `create-skill-test`

Ist `create-skill-test` nur für `dotnet/skills` gedacht?

Ja, sie ist auf die Konventionen des Repositories dotnet/skills und das Layout plugins/<plugin>/skills/ ausgelegt. Sie können die Idee auch anderswo anpassen, aber der Leitfaden zu create-skill-test ist am wertvollsten, wenn Ihr Repo dieselbe Struktur und dieselben Validierungserwartungen hat.

Sollte ich sie statt eines normalen Prompts verwenden?

Verwenden Sie create-skill-test, wenn Sie ein wiederholbares Eval-Scaffold mit weniger Strukturfehlern wollen. Ein normaler Prompt kann einen Test beschreiben, ist aber bei repositoryspezifischen Konventionen, der Platzierung von Fixtures und Overfitting-Prüfungen meist schwächer.

Ist sie anfängerfreundlich?

Ja, wenn Sie den Ziel-Skill benennen und das Szenario in klarer Sprache erklären können. Sie ist nicht anfängerfreundlich, wenn Sie den Plugin-Namen, den Skill-Pfad oder das zu prüfende Verhalten nicht angeben können, weil genau diese Eingaben die generierte Ausgabe steuern.

Wann sollte ich sie nicht verwenden?

Verwenden Sie create-skill-test nicht zum Ausführen von Tests, zum Debuggen von Validator-Fehlern oder zum Schreiben eines neuen Skills. Das sind benachbarte Workflows mit anderen Werkzeugen und anderen Erfolgskriterien.

So verbessern Sie die Skill `create-skill-test`

Geben Sie engere Eingaben vor

Die besten Ergebnisse mit create-skill-test entstehen aus konkreten Szenarien, nicht aus vagen Absichten. „Prüfe, dass der Skill mit fehlendem Kontext umgeht und einen sicheren Fallback zurückgibt“ ist stärker als „mach einen umfassenden Eval“, weil damit klar wird, welches Verhalten zählt und was nicht überbewertet werden soll.

Fordern Sie Rubrikqualität ein, nicht nur YAML

Wenn Sie nur die Struktur anfordern, erhalten Sie möglicherweise eine technisch gültige Datei, die dennoch zu stark überangepasst ist. Sagen Sie, was als Erfolg zählen soll, was fehlschlagen soll und welche Details nebensächlich sind. Das ist der schnellste Weg, die Ergebnisse von create-skill-test for Skill Testing zu verbessern.

Prüfen Sie nach der Generierung auf Overfitting

Schauen Sie nach, ob die Assertions eine einzelne Formulierung, eine feste Reihenfolge oder einen exakten Beispielstring belohnen, außer diese Genauigkeit ist wirklich nötig. Gute Evals messen das Verhalten, das der Skill beibehalten soll, nicht die exakte Wortwahl aus einem einzelnen Lauf.

Verfeinern Sie anhand von Validator-Feedback

Wenn die erste Ausgabe die Validierung nicht besteht, geben Sie die exakte Fehlermeldung zusammen mit dem umliegenden YAML-Ausschnitt zurück. Das führt in der Regel zu einem besseren zweiten Durchlauf, als die gesamte Anfrage noch einmal neu zu formulieren.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

skill-creator

von anthropics

skill-creator ist eine Meta-Skill zur Skill-Erstellung: neue Skills entwerfen, bestehende `SKILL.md` überarbeiten, Evals ausführen, Varianten vergleichen und Trigger-Beschreibungen mit Repo-Skripten und Review-Tools verbessern.

Skill Authoring

Favoriten 2GitHub 105.1k

cpp-testing

von affaan-m

Das cpp-testing Skill hilft dir dabei, C++-Tests mit GoogleTest, GoogleMock, CMake und CTest zu schreiben, auszuführen und zu debuggen. Nutze es für Coverage, das Beheben instabiler Tests, Diagnosen mit Sanitizern und die praxisnahe Anwendung von cpp-testing in modernen C++-Projekten.

Test Automation

Favoriten 0GitHub 156.1k

test-driven-development

von addyosmani

Das test-driven-development-Skill hilft dir, Code zu ändern, indem du zuerst einen fehlschlagenden Test schreibst und dann nur die kleinste nötige Korrektur vornimmst, damit er besteht. Nutze es für Logikänderungen, Bugfixes, Regressionen und Grenzfälle, bei denen ein belastbarer Nachweis wichtiger ist als ein plausibler Patch.

Skill Testing

Favoriten 0GitHub 18.8k

skill-optimizer

von mcollina

skill-optimizer hilft Autoren dabei, AI Skills für Aktivierung, Klarheit und modellübergreifende Zuverlässigkeit zu verbessern. Nutzen Sie es für Skill Authoring, wenn ein Skill zwar geschrieben, aber nicht zuverlässig befolgt wird, wenn Trigger schwach sind, Regressionen auftreten oder der Kontextverbrauch reduziert werden muss. Es unterstützt Benchmark-Zyklen, Release-Gates und eine präzisere Nutzungstreue.

Skill Authoring

Favoriten 0GitHub 1.8k

property-based-testing

von trailofbits

Property-Based-Testing Skill-Guide zum Schreiben, Prüfen und Verbessern von PBT über Sprachen und Smart Contracts hinweg. Nutzen Sie diesen Property-Based-Testing-Guide, um Roundtrip-, Idempotenz-, Invarianten-, Parser-, Validator- und Normalisierungsfälle zu erkennen, Generatoren auszuwählen und zu entscheiden, wann Property-Based-Testing stärker ist als beispielbasierte Tests.

Skill Testing

Favoriten 0GitHub 5k

writing-skills

von obra

writing-skills ist ein Leitfaden für Skill Authoring, mit dem du Agent-Skills in einem testgetriebenen Workflow erstellen, überarbeiten und validieren kannst. Du lernst die wichtigsten Dateien, Voraussetzungen und praktischen Schritte für Druckszenarien, Baseline-Tests und prägnante Iterationen an `SKILL.md` kennen.

Skill Authoring

Favoriten 0GitHub 121.9k

verification-loop

von affaan-m

verification-loop ist ein Claude Code-Verifizierungsworkflow zum Prüfen von Builds, Typen, Linting, Tests, Sicherheit und Diffs nach Codeänderungen. Diese verification-loop-Skill ist vor PRs und nach Refactorings hilfreich, wenn Sie statt einer generischen Eingabeaufforderung eine strukturierte Anleitung für die Prüfung nach Änderungen möchten.

Verification

Favoriten 0GitHub 156.3k

perl-testing

von affaan-m

perl-testing ist ein praxisnaher Leitfaden zum Schreiben, Ausführen und Verbessern von Perl-Tests mit Test2::V0, Test::More, prove, Mocking, Coverage und TDD. Nutzen Sie den perl-testing Skill für Installationshinweise, typische Nutzungsmuster, Migrationshilfe und schnelleres Debugging fehlschlagender Test-Suites.

Skill Testing

Favoriten 0GitHub 156.2k

kotlin-testing

von affaan-m

kotlin-testing ist ein praxisnaher Leitfaden für Kotlin-Testautomatisierung mit Kotest, MockK, Coroutine-Tests, property-basierten Tests und Kover-Coverage. Nutze diesen kotlin-testing Skill, um einem TDD-freundlichen Workflow zu folgen, klarere Unit- und Komponententests zu schreiben und beim Mocking von Abhängigkeiten oder beim Testen von suspendierenden Code weniger zu raten.

Test Automation

Favoriten 0GitHub 156.2k

eval-harness

von affaan-m

Das eval-harness Skill ist ein formaler Evaluierungsrahmen für Claude Code-Sitzungen und eval-getriebene Entwicklung. Es hilft dir dabei, Pass/Fail-Kriterien zu definieren, Capability- und Regression-Evals aufzubauen und die Zuverlässigkeit von Agents vor dem Ausrollen von Prompt- oder Workflow-Änderungen zu messen.

Model Evaluation

Favoriten 0GitHub 156.1k

context-budget

von affaan-m

Der context-budget Skill prüft die Claude-Code-Kontextnutzung über Agents, Skills, Regeln und MCP-Server hinweg. Er hilft dabei, Aufblähungen, doppelte Inhalte und besonders teure Komponenten zu erkennen und liefert anschließend priorisierte Maßnahmen zur Bereinigung. Nutze diesen context-budget Leitfaden für die praktische Verwendung von context-budget und für Skill-Tests in größeren Setups.

Skill Testing

Favoriten 0GitHub 156.1k

skill-judge

von softaworks

skill-judge ist ein Skill zum Reviewen und Bewerten von AI-Skill-Paketen und SKILL.md-Dateien. Es hilft Autorinnen, Autoren und Maintainers dabei, Wissenszuwachs, Aktivierungsklarheit, Workflow-Qualität und Veröffentlichungsreife zu beurteilen – inklusive konkreter Hinweise zur Verbesserung.

Skill Validation

Favoriten 0GitHub 1.3k

playwright-testing

von alinaqi

playwright-testing-Skill zum Schreiben und Debuggen von Playwright-End-to-End-Tests mit Page Objects, Browser-übergreifenden Läufen, CI-tauglichem Setup, Authentifizierungsbehandlung und stabiler Teststruktur.

Skill Testing

Favoriten 0GitHub 607

darwin-skill

von alchaincyf

darwin-skill hilft dabei, SKILL.md-Dateien mit einem wiederholbaren Ablauf zu verbessern: bewerten, überarbeiten, testen und Änderungen anschließend beibehalten oder zurücknehmen. Entwickelt für Skill Authoring, kombiniert es Rubric-Scoring mit promptbasierter Validierung und unterstützt visuelle Ergebnis-Outputs aus Repo-Templates und Assets.

Skill Authoring

Favoriten 0GitHub 549

evaluation

von muratcankoylan

Die Evaluation-Skill hilft dir, Agent-Evaluierungen für nicht-deterministische Systeme zu entwerfen und auszuführen. Verwende sie für die Planung der Evaluation-Installation, Rubriken, Regressionstests, Quality Gates und Evaluationen für Skill Testing. Sie eignet sich für LLM-as-judge-Workflows, mehrdimensionale Bewertungen und den praktischen Einsatz von Evaluationen, wenn reproduzierbare Ergebnisse gefragt sind.

Skill Testing

Favoriten 0GitHub 0

tutor

von RoundTable02

tutor ist eine quizbasierte Lern-Skill für Obsidian-StudyVault-Nutzer, die diagnostische Einschätzungen, Wiederholung auf Konzelebene und Fortschritts-Tracking brauchen. Sie erkennt die Sprache, findet den Vault, liest das Dashboard und trainiert Schwachstellen in strukturierten Sitzungen. Verwende tutor, wenn du wiederholbare Lernchecks statt eines allgemeinen Chat-Tutors brauchst.

Skill Authoring

Favoriten 0GitHub 0

create-skill-test

Überblick über die Skill create-skill-test

Wofür create-skill-test gedacht ist

Wobei sie hilft, Fehler zu vermeiden

Was sie nicht ersetzt

So verwenden Sie die Skill create-skill-test

Installation und die Quelldatei öffnen

Geben Sie der Skill den richtigen Testauftrag

Lesen Sie die relevanten Repository-Bereiche

Szenarien und Rubrics iterativ verbessern

FAQ zur Skill create-skill-test

Ist create-skill-test nur für dotnet/skills gedacht?

Sollte ich sie statt eines normalen Prompts verwenden?

Ist sie anfängerfreundlich?

Wann sollte ich sie nicht verwenden?

So verbessern Sie die Skill create-skill-test

Geben Sie engere Eingaben vor

Fordern Sie Rubrikqualität ein, nicht nur YAML

Prüfen Sie nach der Generierung auf Overfitting

Verfeinern Sie anhand von Validator-Feedback

Bewertungen & Rezensionen

Überblick über die Skill `create-skill-test`

Wofür `create-skill-test` gedacht ist

So verwenden Sie die Skill `create-skill-test`

FAQ zur Skill `create-skill-test`

Ist `create-skill-test` nur für `dotnet/skills` gedacht?

So verbessern Sie die Skill `create-skill-test`