judge

von NeoLabHQ

Judge ist eine zweiphasige Bewertungs-Skill, die zuerst einen Meta-Judge und dann einen Judge-Sub-Agenten startet, um Arbeiten mit isoliertem Kontext, Belegen und klaren Kriterien zu bewerten. Nutzen Sie sie für reine Report-Reviews von Code, Texten, Analysen oder Skill Authoring, wenn Sie einen belastbaren Judge-Leitfaden statt einer lockeren Meinung benötigen.

Stars982

Favoriten0

Kommentare0

Hinzugefügt9. Mai 2026

KategorieSkill Authoring

Installationsbefehl

npx skills add NeoLabHQ/context-engineering-kit --skill judge

Kurationswert

Diese Skill erreicht 66/100 und ist damit grundsätzlich listenfähig, allerdings nur als eher zurückhaltende, mit Hinweisen versehene Option für Nutzer, die einen strukturierten Bewertungs-Workflow suchen. Sie enthält genug echte operative Substanz, um eine Installation zu rechtfertigen, doch Directory-Nutzer sollten mit Interpretationsaufwand rechnen, da das Repo keine unterstützenden Skripte, Referenzen oder einen Installationsbefehl bietet und der Workflow größtenteils in einer einzelnen SKILL.md-Datei steckt.

66/100

Stärken

Klarer Auslöser und klarer Zweck: Die Frontmatter beschreibt, dass zunächst ein Meta-Judge und anschließend ein Judge-Sub-Agent für Bewertungen im aktuellen Gespräch gestartet werden.
Umfangreicher Workflow-Inhalt: Der Skill-Text ist lang, umfasst mehrere Überschriften und definierte Phasen und spricht damit für einen echten Bewertungsprozess statt eines Platzhalters.
Belegorientiertes Design: Es verlangt ausdrücklich strukturiertes Scoring und Zitate, was die Zuverlässigkeit des Agenten gegenüber einem allgemeinen Prompt erhöht.

Hinweise

Keine Support-Dateien und kein Installationsbefehl; die Nutzung hängt daher davon ab, die SKILL.md-Logik zu lesen und manuell anzuwenden.
Die operativen Details bleiben teilweise in Fließtext verborgen; Directory-Nutzer müssen die genauen Ausführungsschritte und den Umgang mit Sonderfällen möglicherweise selbst ableiten.

Claude Claude Code Agents Evaluation Verification Reasoning Context Engineering

Überblick

Überblick über den `judge`-Skill

Was `judge` macht

Der judge-Skill startet einen Evaluierungs-Workflow in zwei Phasen: Zuerst definiert ein Meta-Judge das passende Bewertungsraster für die Aufgabe, danach bewertet ein Judge-Subagent die Arbeit mit isoliertem Kontext und Belegen. Er eignet sich besonders für Nutzer, die eine disziplinierte Prüfung von Code, Analysen, Texten oder Agenten-Ausgaben brauchen – und nicht nur eine lockere Einschätzung.

Wer `judge` verwenden sollte

Nutze den judge-Skill, wenn du eine reine Berichtsauswertung mit klaren Kriterien, Belegen und umsetzbarem Feedback willst. Er passt besonders gut für Reviews im Skill Authoring, für die Prüfung von Repo-Änderungen und für jede Aufgabe, bei der Confirmation Bias oder der Verlauf einer Sitzung das Urteil verfälschen könnten.

Warum er sich unterscheidet

Anders als ein generischer Prompt mit der Bitte um „Feedback“ legt judge die Bewertungskriterien fest, bevor das Scoring beginnt. Das macht den judge-Skill vor allem dann stärker, wenn der Artefakttyp noch unklar ist, wenn du mehrdimensionale Bewertungen brauchst oder wenn das Review für einen anderen Menschen belastbar sein muss.

Den `judge`-Skill verwenden

`judge` installieren und die Einstiegsdatei prüfen

Installiere mit npx skills add NeoLabHQ/context-engineering-kit --skill judge. Beginne mit plugins/sadd/skills/judge/SKILL.md, denn dort stehen der Workflow, die Eingaben und die Bewertungseinschränkungen, die das Installationsverhalten von judge festlegen.

`judge` einen konkreten Bewertungsgegenstand geben

Der Skill funktioniert am besten, wenn du die Arbeit und die Perspektive klar benennst. Ein starker Prompt sieht so aus: Judge the last draft of the launch page for clarity, SEO fit, and factual accuracy. Ein schwacher Prompt wie Review this lässt dem Meta-Judge zu viel Rätselraten.

Den richtigen Kontext für die `judge`-Pipeline mitgeben

Füge das zu bewertende Artefakt, die Erfolgskriterien und harte Vorgaben hinzu, etwa Tonalität, Zielgruppe, Prioritäten im Raster oder verbotene Änderungen. Wenn du judge für Skill Authoring verwendest, sag das ausdrücklich und nenne den Ziel-Skill, weil sich das Raster für Installationsklarheit, Auffindbarkeit und Instruktionsqualität ändern sollte.

Diese Dateien zuerst lesen

Für Installation und Anpassung solltest du zuerst SKILL.md lesen und danach alle Workflow- oder Policy-Dateien, die das Repo enthält. In diesem Repository ist der Skill-Text selbst die wichtigste Quelle der Wahrheit, deshalb ist der schnellste Weg, zuerst die Prompt-Struktur, die Workflow-Phasen und die Beleganforderungen zu prüfen, bevor du das Muster in dein eigenes System übernimmst.

FAQ zum `judge`-Skill

Ist `judge` nur für Code-Reviews gedacht?

Nein. Der judge-Skill ist dafür gedacht, jede Art von Ergebnis zu bewerten, die von einem Bewertungsraster profitiert: Prompts, Dokumentationen, Analysen, Agenten-Ausgaben oder Designentscheidungen. Die entscheidende Voraussetzung ist, dass das Ergebnis anhand expliziter Kriterien und mit Belegen beurteilt werden kann.

Wann sollte ich `judge` nicht verwenden?

Nutze judge nicht, wenn du nur eine schnelle subjektive Reaktion brauchst, wenn noch kein fertiges Artefakt vorliegt oder wenn sich die Aufgabe nicht aus Belegen bewerten lässt. In solchen Fällen ist ein einfacher Prompt meist schneller und weniger fehleranfällig.

Ist `judge` für Anfänger geeignet?

Ja, sofern der Nutzer das Artefakt und die Erfolgskriterien benennen kann. Anfänger haben in der Regel nur dann Probleme, wenn sie ein Urteil ohne Kontext verlangen. Der Skill entschärft das, indem er einen Meta-Judge-Schritt erzwingt, aber einen klaren Zielgegenstand braucht er trotzdem.

Worin unterscheidet sich `judge` von einem normalen Prompt?

Ein normaler Prompt lässt oft ein Modell in einem Durchgang sowohl die Kriterien erfinden als auch das Ergebnis bewerten. Der judge-Skill trennt diese Rollen, was in der Regel die Konsistenz verbessert, Bias reduziert und den Abschlussbericht vertrauenswürdiger macht.

Den `judge`-Skill verbessern

Den Bewertungsgegenstand eindeutig machen

Die besten Inputs für judge nennen das genaue Artefakt, die gewünschte Zielgruppe und die Entscheidung, die du unterstützen willst. Zum Beispiel: Evaluate the new onboarding doc for first-time contributors, with emphasis on setup clarity and missing prerequisites. Das ist besser als Check my doc, weil sich das Bewertungsraster so an echtem Nutzerrisiko ausrichten kann.

Einschränkungen ergänzen, die das Raster beeinflussen

Wenn dir Belege auf Zeilenebene, Zitieranforderungen oder eine bestimmte Skala wichtig sind, sag das von Anfang an. judge arbeitet besser, wenn es weiß, ob Korrektheit, Vollständigkeit, UX-Klarheit oder Policy-Compliance Vorrang haben soll, statt diese Punkte implizit zu mitteln.

Nach dem ersten Bericht iterieren

Nutze den ersten judge-Bericht, um den nächsten Prompt zu schärfen: ergänze fehlenden Kontext, kläre Zielkonflikte und nenne jeden Abschnitt, der aus deiner Sicht zu niedrig gewichtet wurde. Für Skill Authoring ist die nützlichste Iteration oft, judge die Installationsklarheit, die Realitätsnähe der Nutzung und Grenzfälle getrennt neu bewerten zu lassen.

Typische Fehlermodi im Blick behalten

judge kann schwächer abschneiden, wenn die Ausgangsarbeit vage ist, wenn das Artefakt unvollständig ist oder wenn der Bewertungsfokus mit zu vielen Zielen überladen wird. In diesem Fall solltest du die Aufgabe in engere Durchgänge aufteilen und judge nur das Material geben, das für die jeweilige Entscheidung nötig ist.

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

create-colleague

von titanwings

create-colleague macht aus Dokumenten, Chats, E-Mails, Screenshots, Feishu- und DingTalk-Daten von Kolleg:innen ein bearbeitbares AI-Skill mit getrennten Ausgaben für Arbeitsweise und Persona sowie Update-Abläufen für die laufende Verfeinerung.

Skill Authoring

Favoriten 1GitHub 747

skill-creator

von anthropics

skill-creator ist eine Meta-Skill zur Skill-Erstellung: neue Skills entwerfen, bestehende `SKILL.md` überarbeiten, Evals ausführen, Varianten vergleichen und Trigger-Beschreibungen mit Repo-Skripten und Review-Tools verbessern.

Skill Authoring

Favoriten 2GitHub 105.1k

lean-ux-canvas

von deanpeters

lean-ux-canvas hilft Teams dabei, ein Geschäftsproblem zu schärfen, Annahmen offenzulegen und mit dem Lean UX Canvas v2 festzulegen, was als Nächstes gelernt werden soll. Nutze es für die Vorbereitung von Workshops, zur Abstimmung mit Stakeholdern und für frühe Product-Discovery-Phasen, wenn du vor der Lösungsentwicklung einen praxisnahen lean-ux-canvas-Leitfaden brauchst.

Skill Authoring

Favoriten 0GitHub 4.1k

documentation-lookup

von affaan-m

documentation-lookup hilft Agenten, Fragen zu Bibliotheken, Frameworks und APIs aus aktueller Dokumentation statt aus dem Gedächtnis zu beantworten. Es ist ideal für Aufgaben zu Einrichtung, Konfiguration, Referenz und Codebeispielen, wenn die neueste Syntax zählt. Verwenden Sie die documentation-lookup-Skill für Skill Docs, wenn eine Anfrage von Live-Dokumentation und versionsgenauer Anleitung abhängt.

Skill Docs

Favoriten 0GitHub 156.1k

mcp-builder

von anthropics

mcp-builder ist ein praxisnaher Leitfaden zum Planen, Entwickeln und Bewerten von MCP-Servern für externe APIs und Dienste. Er unterstützt Entwickler bei Tool-Umfang, Benennung, Transport, Python- oder Node-Implementierungsmustern und Evaluierungs-Workflows, damit Agents den Server zuverlässig nutzen können.

MCP Server Development

Favoriten 0GitHub 105k

user-story

von deanpeters

Das user-story Skill hilft dir, Produktanforderungen in eine einzelne, entwicklungsreife Story mit Formulierungen nach Mike Cohn und Gherkin-Abnahmekriterien zu überführen. Nutze es für klarere Übergaben, bessere Aufwandsschätzung und einen präziseren User-Story-Guide für Technical Writing- und Produktteams.

Technical Writing

Favoriten 0GitHub 4.1k

user-story-splitting

von deanpeters

Die User-Story-Splitting-Skill hilft dabei, große Epics und User Stories mithilfe strukturierter Muster in kleinere, unabhängig lieferbare Stories zu zerlegen. Nutzen Sie sie für Schätzung, Sequenzierung, Risikoreduzierung und Skill-Authoring-Workflows, wenn ein Backlog-Item für einen einzelnen Sprint zu umfangreich ist.

Skill Authoring

Favoriten 0GitHub 0

sanity-best-practices

von sanity-io

Der Skill „sanity-best-practices“ hilft dir, die passenden Sanity-Patterns zu wählen, bevor du mit der Umsetzung beginnst. Nutze ihn für Schemas, GROQ, TypeGen, Visual Editing, Portable Text, Lokalisierung, Migrationen, Functions, Blueprints und Frontend-Integrationen wie Next.js, Nuxt, Astro, Remix, SvelteKit, Angular, Hydrogen und das App SDK.

Frontend Development

Favoriten 0GitHub 0

provider-docs

von hashicorp

Die provider-docs-Skill hilft dir, Terraform-Registry-Dokumentation für Terraform-Provider zu erstellen, zu aktualisieren und zu prüfen. Nutze sie für provider-docs-Guide-Arbeiten, provider-docs für Technical Writing und um Schema-Beschreibungen, tfplugindocs-Templates und Registry-Ausgaben bei Dokumentationsänderungen synchron zu halten.

Technical Writing

Favoriten 0GitHub 0

press-release

von deanpeters

Die press-release-Skill hilft dir, vor dem Bau eine Amazon-typische Working-Backwards-Pressemitteilung zu entwerfen. Nutze sie, um den Kundennutzen zu schärfen, eine Produkt- oder Feature-Idee zu testen und Stakeholder mit einer knappen, kundenorientierten Storyline auf Linie zu bringen. Besonders hilfreich für press-release für Technical Writing und frühe Produktplanung.

Technical Writing

Favoriten 0GitHub 4.1k

writing-skills

von obra

writing-skills ist ein Leitfaden für Skill Authoring, mit dem du Agent-Skills in einem testgetriebenen Workflow erstellen, überarbeiten und validieren kannst. Du lernst die wichtigsten Dateien, Voraussetzungen und praktischen Schritte für Druckszenarien, Baseline-Tests und prägnante Iterationen an `SKILL.md` kennen.

Skill Authoring

Favoriten 0GitHub 121.9k

prd-generator

von ognjengt

prd-generator verwandelt eine grobe Produktidee in ein AI-taugliches Product Requirements Document. Es stellt klärende Fragen, folgt einer festen Vorlage und hilft Gründern, Produktverantwortlichen und Skill-Authoring-Workflows dabei, präzisere Spezifikationen für nachgelagerte KI-Coding-Tools zu erstellen. Verwende prd-generator, wenn du strukturierte Anforderungen, Kennzahlen, Einschränkungen und umsetzungsrelevanten Kontext brauchst.

Skill Authoring

Favoriten 0GitHub 0

command-creator

von softaworks

command-creator hilft dabei, wiederkehrende Claude-Code-Workflows in wiederverwendbare Slash-Commands zu verwandeln. Sie lernen das passende Command-Muster kennen, formulieren agent-ausführbare Anweisungen, wählen zwischen `.claude/commands/` und `~/.claude/commands/` und nutzen die mitgelieferten Referenzen für Beispiele und Best Practices.

Skill Authoring

Favoriten 0GitHub 1.3k

altitude-horizon-framework

von deanpeters

altitude-horizon-framework ist ein Entscheidungs-Framework für den Übergang von PM zu Director. Nutzen Sie es, um Lücken bei Height und Scope zu diagnostizieren, Scope und Timing zu klären und die Cascading Context Map einzusetzen, wenn die Strategie unklar ist. Enthalten sind praktische Hinweise zu Installation, Nutzung und Beispielen für das Erstellen eigener Skills.

Skill Authoring

Favoriten 0GitHub 4.1k

prompt-optimizer

von affaan-m

prompt-optimizer ist ein prompt-optimizer-Skill, der grobe Prompts analysiert, fehlenden Kontext aufspürt und sie in klarere, direkt einsetzbare Prompts umschreibt. Er eignet sich besonders für prompt-optimizer-Leitfäden, Prompt-Review und prompt-optimizer für Prompt Writing – vor allem, wenn du für Claude Code oder ECC-Workflows eine bessere Struktur brauchst. Die eigentliche Aufgabe führt er nicht aus.

Prompt Writing

Favoriten 0GitHub 156.2k

continuous-learning-v2

von affaan-m

continuous-learning-v2 macht aus Claude Code-Sitzungen projektbezogenes Lernen mit Hooks, Observer-Agents, Confidence-Scoring und der Überführung wiederkehrender Muster in Skills, Commands oder Agents.

Skill Authoring

Favoriten 0GitHub 156.1k

judge

Überblick über den judge-Skill

Was judge macht

Wer judge verwenden sollte

Warum er sich unterscheidet

Den judge-Skill verwenden

judge installieren und die Einstiegsdatei prüfen

judge einen konkreten Bewertungsgegenstand geben

Den richtigen Kontext für die judge-Pipeline mitgeben

Diese Dateien zuerst lesen

FAQ zum judge-Skill

Ist judge nur für Code-Reviews gedacht?

Wann sollte ich judge nicht verwenden?

Ist judge für Anfänger geeignet?

Worin unterscheidet sich judge von einem normalen Prompt?

Den judge-Skill verbessern

Den Bewertungsgegenstand eindeutig machen

Einschränkungen ergänzen, die das Raster beeinflussen

Nach dem ersten Bericht iterieren

Typische Fehlermodi im Blick behalten

Bewertungen & Rezensionen

Überblick über den `judge`-Skill

Was `judge` macht

Wer `judge` verwenden sollte

Den `judge`-Skill verwenden

`judge` installieren und die Einstiegsdatei prüfen

`judge` einen konkreten Bewertungsgegenstand geben

Den richtigen Kontext für die `judge`-Pipeline mitgeben

FAQ zum `judge`-Skill

Ist `judge` nur für Code-Reviews gedacht?

Wann sollte ich `judge` nicht verwenden?

Ist `judge` für Anfänger geeignet?

Worin unterscheidet sich `judge` von einem normalen Prompt?

Den `judge`-Skill verbessern