Skill Validation

Explorez les agent skills lies a Skill Validation dans Creation de skills et comparez les workflows, outils et cas d usage associes.

31 skills

continuous-learning-v2

par affaan-m

continuous-learning-v2 transforme les sessions Claude Code en apprentissage par projet, avec des hooks, des agents observateurs, un scoring de confiance et la promotion des motifs récurrents en skills, commandes ou agents.

Skill Authoring

Favoris 1GitHub 156.1k

springboot-verification

par affaan-m

springboot-verification est une boucle de vérification pour les projets Spring Boot, conçue pour vous aider à confirmer qu’un changement est sûr avant une PR ou un déploiement. Utilisez ce guide springboot-verification pour la validation du build, l’analyse statique, les tests avec couverture, les scans de sécurité et la Skill Validation.

Skill Validation

Favoris 0GitHub 156.3k

santa-method

par affaan-m

santa-method est un workflow de vérification multi-agent pour les livrables qui doivent être justes avant leur publication. Il s’appuie sur des revues indépendantes pour repérer les angles morts dans le contenu, les livrables proches du code, les textes sensibles sur le plan de la conformité et les tâches d’automatisation de workflow. Installez le skill santa-method lorsque vous avez besoin d’une boucle reproductible générer, vérifier, converger.

Workflow Automation

Favoris 0GitHub 156.2k

rules-distill

par affaan-m

rules-distill est un skill de maintenance destiné aux auteurs de skills et aux curateurs de bibliothèques de prompts. Il analyse les skills installés, en extrait les schémas récurrents sous forme de règles réutilisables, et vous aide à ajouter, réviser ou créer des fichiers de règles avec moins d’approximations qu’avec un simple prompt de revue générique.

Skill Authoring

Favoris 0GitHub 156.2k

eval-harness

par affaan-m

Le skill eval-harness est un cadre d’évaluation formel pour les sessions Claude Code et le développement guidé par l’évaluation. Il vous aide à définir des critères de réussite/échec, à construire des évaluations de capacités et de régression, et à mesurer la fiabilité de l’agent avant de déployer des changements de prompt ou de workflow.

Model Evaluation

Favoris 0GitHub 156.1k

context-budget

par affaan-m

Le skill context-budget audite l’utilisation du contexte de Claude Code à travers les agents, les skills, les règles et les serveurs MCP. Il aide à repérer le gonflement, les doublons et les composants coûteux, puis renvoie des actions de nettoyage priorisées. Utilisez ce guide context-budget pour un usage pratique du budget de contexte et pour les tests de skill dans les configurations plus importantes.

Skill Testing

Favoris 0GitHub 156.1k

agent-sort

par affaan-m

agent-sort est un skill sensible au dépôt pour construire un plan d'installation ECC fondé sur des preuves. Il aide à classer les skills, commandes, règles, hooks et extras en catégories DAILY ou LIBRARY, afin d’installer uniquement ce que le projet utilise réellement. Utilisez le skill agent-sort pour vos décisions d’installation, l’usage de agent-sort, et comme guide pratique agent-sort pour les workflows de Skill Authoring.

Skill Authoring

Favoris 0GitHub 156k

writing-skills

par obra

writing-skills est un guide de Skill Authoring pour créer, modifier et valider des agent skills avec une approche pilotée par les tests. Découvrez les fichiers clés, les prérequis et les étapes concrètes pour les scénarios de pression, les tests de référence et l’itération concise de `SKILL.md`.

Skill Authoring

Favoris 0GitHub 121.9k

verification-before-completion

par obra

verification-before-completion est une skill de vérification finale qui empêche les affirmations de fin de tâche non étayées. Découvrez quand l’utiliser, comment l’installer depuis obra/superpowers, et comment associer chaque statut annoncé à une preuve de vérification récente.

Skill Validation

Favoris 0GitHub 121.9k

skill-creator

par anthropics

skill-creator est une méta-skill de création de skills pour rédiger de nouvelles skills, réviser des fichiers SKILL.md, lancer des évaluations, comparer des variantes et améliorer les descriptions de déclenchement avec les scripts du dépôt et des outils de revue.

Skill Authoring

Favoris 2GitHub 105.1k

evaluation-methodology

par wshobson

La compétence evaluation-methodology explique le scoring PluginEval pour Model Evaluation, avec les couches d’évaluation, les rubrics, le score composite, les seuils de badges et des conseils pratiques pour interpréter les résultats et améliorer les dimensions faibles.

Model Evaluation

Favoris 0GitHub 32.6k

context-degradation

par muratcankoylan

context-degradation est un skill pratique pour diagnostiquer les défaillances de contexte dans les workflows longs, notamment les cas de lost-in-the-middle, de poisoning, de distraction, de confusion et de clash. Utilisez-le pour repérer où le contexte se rompt, décider quoi corriger en premier et appliquer un guide reproductible de dégradation du contexte pour le Skill Authoring, le placement des prompts et le débogage d’agents en production.

Skill Authoring

Favoris 0GitHub 15.6k

context-fundamentals

par muratcankoylan

context-fundamentals est un guide pratique de l’ingénierie du contexte pour les systèmes d’agents IA. Il vous aide à décider ce qui doit entrer dans le prompt, à diagnostiquer les problèmes de contexte et à gérer les budgets de tokens grâce à une structure de contexte plus claire. Utilisez ce skill context-fundamentals lorsque vous avez besoin d’un guide concret sur context-fundamentals pour la conception d’agents et l’optimisation des prompts.

Context Engineering

Favoris 0GitHub 15.6k

skill-builder

par yusufkaraaslan

skill-builder aide les auteurs de skills à transformer des docs, des dépôts GitHub, des PDF, des vidéos et des bases de code en skills prêts pour l’IA avec Skill Seekers. Il inclut la détection du type de source, un workflow recommandé et des étapes guidées par des outils pour créer des skills de façon reproductible, plutôt que de s’en remettre à des prompts ponctuels.

Skill Authoring

Favoris 0GitHub 13.5k

testing-handbook-generator

par trailofbits

testing-handbook-generator est un méta-skill conçu pour créer des skills Claude Code à partir du Trail of Bits Testing Handbook (appsec.guide). Il aide les auteurs de skills, les ingénieurs sécurité et les mainteneurs à transformer des sections du handbook en skills réutilisables, avec un workflow clair, un périmètre maîtrisé et une génération reproductible. Utilisez le skill testing-handbook-generator quand vous avez besoin d’un guide testing-handbook-generator pour concevoir des skills à partir du handbook.

Skill Authoring

Favoris 0GitHub 5k

audit-prep-assistant

par trailofbits

audit-prep-assistant prépare les bases de code pour un Security Audit à l’aide de la checklist de Trail of Bits. Il aide à définir les objectifs de revue, lancer l’analyse statique, augmenter la couverture de tests, supprimer le code mort, documenter les risques et générer des éléments de समर्थन pour faciliter la remise d’audit.

Security Audit

Favoris 0GitHub 4.9k

create-skill-test

par dotnet

create-skill-test génère des fichiers de test `eval.yaml` pour les skills d’agent dans `dotnet/skills`. Utilisez-le pour créer des tests de skill, définir des scénarios, des fixtures, des assertions et des grilles d’évaluation, tout en réduisant le surapprentissage dans la conception des évaluations. Il ne sert pas à exécuter des tests existants, à déboguer des erreurs de validateur ni à rédiger des fichiers `SKILL.md`.

Skill Testing

Favoris 0GitHub 3k

create-skill

par dotnet

create-skill est un générateur de squelette pour créer de nouvelles compétences d’agent, dans l’esprit dotnet/skills. Utilisez-le pour créer un dossier de compétence valide, générer `SKILL.md` avec frontmatter et suivre les conventions du dépôt pour le scaffolding de compétences. Il convient surtout à la création de nouvelles compétences, pas à la modification de compétences existantes.

Skill Scaffolding

Favoris 0GitHub 3k

skill-optimizer

par mcollina

skill-optimizer aide les auteurs à améliorer des skills IA en matière d’activation, de clarté et de fiabilité entre modèles. Utilisez-le pour la Skill Authoring lorsqu’un skill est rédigé mais pas suivi de façon fiable, lorsque les déclencheurs sont faibles, que des régressions apparaissent ou qu’il faut réduire le coût en contexte. Il prend en charge les boucles de benchmark, les garde-fous de release et un meilleur respect d’usage.

Skill Authoring

Favoris 0GitHub 1.8k

skill-judge

par softaworks

skill-judge est un skill de revue et de scoring conçu pour auditer des packages de skills IA et des fichiers SKILL.md. Il aide les auteurs et les mainteneurs à évaluer l’écart de connaissance, la clarté d’activation, la qualité du workflow et le niveau de préparation à la publication, avec des pistes d’amélioration concrètes.

Skill Validation

Favoris 0GitHub 1.3k

judge

par NeoLabHQ

Judge est un skill d’évaluation en deux phases qui lance d’abord un méta-judge, puis un sous-agent judge pour noter un travail avec un contexte isolé, des preuves et des critères clairs. Utilisez-le pour des revues en mode rapport uniquement sur du code, des textes, des analyses ou du Skill Authoring lorsque vous avez besoin d’un guide de jugement défendable plutôt que d’un simple avis informel.

Skill Authoring

Favoris 0GitHub 982

do-and-judge

par NeoLabHQ

La compétence do-and-judge exécute une tâche unique avec une étape d’implémentation par sous-agent, un juge indépendant et une vérification par itérations jusqu’à validation ou atteinte du nombre maximal de tentatives. Utilisez do-and-judge pour l’automatisation des workflows lorsque vous avez besoin de critères d’acceptation clairs, d’une exécution isolée et de moins d’incertitude qu’avec un prompt générique.

Workflow Automation

Favoris 0GitHub 982

llm-patterns

par alinaqi

llm-patterns vous aide à concevoir une logique applicative orientée IA, où les LLM prennent en charge le raisonnement, l’extraction et la génération, tandis que le code gère la validation, l’orientation et le traitement des erreurs. Utilisez la skill llm-patterns pour structurer plus clairement vos prompts, créer des workflows LLM testables et bénéficier de conseils pratiques pour la création de skills.

Skill Authoring

Favoris 0GitHub 607

darwin-skill

par alchaincyf

darwin-skill aide à améliorer les fichiers SKILL.md grâce à une boucle reproductible : évaluer, réviser, tester, puis conserver ou annuler les changements. Conçu pour le Skill Authoring, il combine un scoring par grille d’évaluation avec une validation basée sur des prompts et prend en charge des sorties visuelles à partir de modèles et d’assets du dépôt.

Skill Authoring

Favoris 0GitHub 549