Skill Validation

Entdecke Skill Validation Agent Skills in Skill-Aufbau und vergleiche verwandte Workflows, Tools und Einsatzfaelle.

31 Skills

springboot-verification

von affaan-m

springboot-verification ist ein Verifikations-Loop für Spring-Boot-Projekte, mit dem du vor einem PR oder Deploy prüfen kannst, ob eine Änderung sicher ist. Nutze diesen springboot-verification-Leitfaden für Build-Validierung, statische Analyse, Tests mit Coverage, Security-Scans und Skill-Validation.

Skill Validation

Favoriten 0GitHub 156.3k

santa-method

von affaan-m

santa-method ist ein Multi-Agenten-Verifizierungsworkflow für Ergebnisse, die vor der Auslieferung korrekt sein müssen. Er nutzt unabhängige Prüfung, um blinde Flecken in Inhalten, code-nahen Deliverables, compliance-sensiblem Text und Aufgaben der Workflow-Automatisierung aufzudecken. Installieren Sie das santa-method Skill, wenn Sie eine wiederholbare Generate-Verify-Converge-Schleife benötigen.

Workflow Automation

Favoriten 0GitHub 156.2k

rules-distill

von affaan-m

rules-distill ist ein Wartungsskill für Skill-Autoren und Kuratoren von Prompt-Bibliotheken. Er durchsucht installierte Skills, destilliert wiederkehrende Muster zu wiederverwendbaren Regeln und hilft dabei, Regeldateien anzuhängen, zu überarbeiten oder neu anzulegen – mit deutlich weniger Rätselraten als bei einem generischen Review-Prompt.

Skill Authoring

Favoriten 0GitHub 156.2k

eval-harness

von affaan-m

Das eval-harness Skill ist ein formaler Evaluierungsrahmen für Claude Code-Sitzungen und eval-getriebene Entwicklung. Es hilft dir dabei, Pass/Fail-Kriterien zu definieren, Capability- und Regression-Evals aufzubauen und die Zuverlässigkeit von Agents vor dem Ausrollen von Prompt- oder Workflow-Änderungen zu messen.

Model Evaluation

Favoriten 0GitHub 156.1k

continuous-learning-v2

von affaan-m

continuous-learning-v2 macht aus Claude Code-Sitzungen projektbezogenes Lernen mit Hooks, Observer-Agents, Confidence-Scoring und der Überführung wiederkehrender Muster in Skills, Commands oder Agents.

Skill Authoring

Favoriten 0GitHub 156.1k

context-budget

von affaan-m

Der context-budget Skill prüft die Claude-Code-Kontextnutzung über Agents, Skills, Regeln und MCP-Server hinweg. Er hilft dabei, Aufblähungen, doppelte Inhalte und besonders teure Komponenten zu erkennen und liefert anschließend priorisierte Maßnahmen zur Bereinigung. Nutze diesen context-budget Leitfaden für die praktische Verwendung von context-budget und für Skill-Tests in größeren Setups.

Skill Testing

Favoriten 0GitHub 156.1k

agent-sort

von affaan-m

agent-sort ist eine repo-aware Skill für einen evidenzbasierten ECC-Installationsplan. Sie hilft dabei, Skills, Befehle, Regeln, Hooks und Extras in DAILY- und LIBRARY-Buckets einzuordnen, damit du nur das installierst, was das Projekt tatsächlich nutzt. Verwende die agent-sort Skill für Installationsentscheidungen, zur agent-sort-Nutzung und als praxisnahen agent-sort-Leitfaden für Skill-Authoring-Workflows.

Skill Authoring

Favoriten 0GitHub 156k

writing-skills

von obra

writing-skills ist ein Leitfaden für Skill Authoring, mit dem du Agent-Skills in einem testgetriebenen Workflow erstellen, überarbeiten und validieren kannst. Du lernst die wichtigsten Dateien, Voraussetzungen und praktischen Schritte für Druckszenarien, Baseline-Tests und prägnante Iterationen an `SKILL.md` kennen.

Skill Authoring

Favoriten 0GitHub 121.9k

verification-before-completion

von obra

verification-before-completion ist ein Skill für den abschließenden Check, der unbelegte Abschlussbehauptungen verhindert. Hier erfahren Sie, wann Sie ihn einsetzen, wie Sie ihn aus obra/superpowers installieren und wie Sie jede Statusaussage mit aktueller Verifikations-Evidenz absichern.

Skill Validation

Favoriten 0GitHub 121.9k

skill-creator

von anthropics

skill-creator ist eine Meta-Skill zur Skill-Erstellung: neue Skills entwerfen, bestehende `SKILL.md` überarbeiten, Evals ausführen, Varianten vergleichen und Trigger-Beschreibungen mit Repo-Skripten und Review-Tools verbessern.

Skill Authoring

Favoriten 2GitHub 105.1k

evaluation-methodology

von wshobson

Die evaluation-methodology Skill erklärt das PluginEval-Scoring für Model Evaluation, einschließlich Ebenen, Rubriken, zusammengesetzter Bewertung, Badge-Schwellen und praxisnaher Hinweise zur Interpretation von Ergebnissen und zur Verbesserung schwacher Dimensionen.

Model Evaluation

Favoriten 0GitHub 32.6k

context-degradation

von muratcankoylan

context-degradation ist eine praxisnahe Skill-Lösung zum Diagnostizieren von Kontextfehlern in langen Workflows, darunter lost-in-the-middle, poisoning, distraction, confusion und clash. Verwende es, um zu erkennen, wo der Kontext bricht, zu entscheiden, was zuerst geändert werden sollte, und einen wiederholbaren context-degradation-Leitfaden für Skill Authoring, Prompt-Platzierung und das Debugging produktiver Agenten anzuwenden.

Skill Authoring

Favoriten 0GitHub 15.6k

context-fundamentals

von muratcankoylan

context-fundamentals ist ein praxisnaher Leitfaden für Context Engineering in KI-Agentensystemen. Er hilft dir dabei zu entscheiden, was in den Prompt gehört, Context-Probleme zu debuggen und Token-Budgets mit einer klareren Context-Struktur zu steuern. Nutze diesen context-fundamentals Skill, wenn du einen fundierten Leitfaden für Agentendesign und Prompt-Optimierung brauchst.

Context Engineering

Favoriten 0GitHub 15.6k

skill-builder

von yusufkaraaslan

skill-builder hilft Skill-Autoren dabei, Docs, GitHub-Repos, PDFs, Videos und Codebases mit Skill Seekers in AI-ready Skills zu verwandeln. Es umfasst eine Erkennung des Quellentyps, einen empfohlenen Workflow und toolbasierte Schritte für wiederholbares Skill Authoring statt einmaligem Prompting.

Skill Authoring

Favoriten 0GitHub 13.5k

testing-handbook-generator

von trailofbits

testing-handbook-generator ist eine Meta-Skill zum Erstellen von Claude Code Skills aus dem Trail of Bits Testing Handbook (appsec.guide). Sie hilft Skill-Autor:innen, Security Engineers und Maintainer:innen dabei, Handbuchabschnitte in wiederverwendbare Skills mit klarem Workflow, sauberem Scope-Management und reproduzierbarer Generierung zu überführen. Nutze die testing-handbook-generator Skill, wenn du einen testing-handbook-generator Leitfaden für das Authoring vom Handbuch zum Skill brauchst.

Skill Authoring

Favoriten 0GitHub 5k

audit-prep-assistant

von trailofbits

audit-prep-assistant bereitet Codebasen mithilfe der Checkliste von Trail of Bits auf ein Security Audit vor. Es hilft dabei, Review-Ziele festzulegen, statische Analysen auszuführen, die Testabdeckung zu erhöhen, toten Code zu entfernen, Risiken zu dokumentieren und unterstützende Artefakte für eine saubere Übergabe ins Audit zu erstellen.

Security Audit

Favoriten 0GitHub 4.9k

create-skill-test

von dotnet

create-skill-test erstellt Gerüstdateien vom Typ `eval.yaml` für Agent-Skills in `dotnet/skills`. Verwende es, um Skill-Tests anzulegen, Szenarien, Fixtures, Assertions und Rubrics zu definieren und Overfitting im Evaluationsdesign zu reduzieren. Es ist nicht dafür gedacht, vorhandene Tests auszuführen, Validator-Fehler zu debuggen oder `SKILL.md`-Dateien zu erstellen.

Skill Testing

Favoriten 0GitHub 3k

create-skill

von dotnet

create-skill ist ein Scaffold-Generator für neue Agent-Skills im Stil von dotnet/skills. Verwende ihn, um einen gültigen Skill-Ordner anzulegen, `SKILL.md` mit Frontmatter zu erzeugen und den Repository-Konventionen für Skill-Scaffolding zu folgen. Er eignet sich vor allem für neue Skills, nicht für die Bearbeitung bestehender.

Skill Scaffolding

Favoriten 0GitHub 3k

skill-optimizer

von mcollina

skill-optimizer hilft Autoren dabei, AI Skills für Aktivierung, Klarheit und modellübergreifende Zuverlässigkeit zu verbessern. Nutzen Sie es für Skill Authoring, wenn ein Skill zwar geschrieben, aber nicht zuverlässig befolgt wird, wenn Trigger schwach sind, Regressionen auftreten oder der Kontextverbrauch reduziert werden muss. Es unterstützt Benchmark-Zyklen, Release-Gates und eine präzisere Nutzungstreue.

Skill Authoring

Favoriten 0GitHub 1.8k

skill-judge

von softaworks

skill-judge ist ein Skill zum Reviewen und Bewerten von AI-Skill-Paketen und SKILL.md-Dateien. Es hilft Autorinnen, Autoren und Maintainers dabei, Wissenszuwachs, Aktivierungsklarheit, Workflow-Qualität und Veröffentlichungsreife zu beurteilen – inklusive konkreter Hinweise zur Verbesserung.

Skill Validation

Favoriten 0GitHub 1.3k

judge

von NeoLabHQ

Judge ist eine zweiphasige Bewertungs-Skill, die zuerst einen Meta-Judge und dann einen Judge-Sub-Agenten startet, um Arbeiten mit isoliertem Kontext, Belegen und klaren Kriterien zu bewerten. Nutzen Sie sie für reine Report-Reviews von Code, Texten, Analysen oder Skill Authoring, wenn Sie einen belastbaren Judge-Leitfaden statt einer lockeren Meinung benötigen.

Skill Authoring

Favoriten 0GitHub 982

do-and-judge

von NeoLabHQ

Die do-and-judge Skill führt eine einzelne Aufgabe mit einem Implementierungsschritt durch einen Sub-Agenten, einem unabhängigen Judge und einer verifizierenden Wiederholung aus, bis das Ergebnis besteht oder die maximale Anzahl an Versuchen erreicht ist. Verwenden Sie do-and-judge für Workflow-Automatisierung, wenn Sie klare Akzeptanzkriterien, isolierte Ausführung und weniger Rätselraten als bei einem generischen Prompt brauchen.

Workflow Automation

Favoriten 0GitHub 982

llm-patterns

von alinaqi

llm-patterns hilft dir, AI-first-Anwendungslogik zu entwerfen, bei der LLMs das Denken, Extrahieren und Generieren übernehmen, während Code für Validierung, Routing und Fehlerbehandlung zuständig ist. Nutze das llm-patterns Skill für eine klarere Prompt-Struktur, testbare LLM-Workflows und praxisnahe Hinweise zum Skill Authoring.

Skill Authoring

Favoriten 0GitHub 607

darwin-skill

von alchaincyf

darwin-skill hilft dabei, SKILL.md-Dateien mit einem wiederholbaren Ablauf zu verbessern: bewerten, überarbeiten, testen und Änderungen anschließend beibehalten oder zurücknehmen. Entwickelt für Skill Authoring, kombiniert es Rubric-Scoring mit promptbasierter Validierung und unterstützt visuelle Ergebnis-Outputs aus Repo-Templates und Assets.

Skill Authoring

Favoriten 0GitHub 549