create-skill-test

par dotnet

create-skill-test génère des fichiers de test `eval.yaml` pour les skills d’agent dans `dotnet/skills`. Utilisez-le pour créer des tests de skill, définir des scénarios, des fixtures, des assertions et des grilles d’évaluation, tout en réduisant le surapprentissage dans la conception des évaluations. Il ne sert pas à exécuter des tests existants, à déboguer des erreurs de validateur ni à rédiger des fichiers `SKILL.md`.

Étoiles3k

Favoris0

Commentaires0

Ajouté25 mai 2026

CatégorieSkill Testing

Commande d’installation

npx skills add dotnet/skills --skill create-skill-test

Score éditorial

Ce skill obtient un score de 62/100, ce qui le rend publiable mais à utiliser avec prudence : il offre aux utilisateurs du répertoire un vrai workflow ciblé pour générer des fichiers de test `eval.yaml`, mais il est plus étroit et plus lié au dépôt qu’un skill largement réutilisable.

62/100

Points forts

Déclenchement clair : le frontmatter indique qu’il faut l’utiliser pour créer des fichiers de test `eval.yaml`, ajouter des scénarios, mettre en place des fixtures et évaluer le risque de surapprentissage.
Workflow opérationnel et concret : le corps du document fournit des entrées explicites, des indications précises sur quand l’utiliser ou non, ainsi qu’un processus en plusieurs étapes avec des contraintes.
Bonne valeur pour la décision d’installation pour les contributeurs de `dotnet/skills` : il fait référence aux vérifications du validateur et aux conventions du dépôt, ce qui réduit les incertitudes par rapport à un prompt générique.

Points de vigilance

Il est expérimental, orienté tests et limité aux conventions de `dotnet/skills`, donc il se transpose mal en dehors de ce dépôt.
Aucun script, aucune référence ni aucun fichier de support n’est inclus ; les utilisateurs doivent donc s’appuyer uniquement sur le document pour les détails d’implémentation.

Test Template Docs Developer Audience Dotnet

Vue d’ensemble

Aperçu de la compétence `create-skill-test`

create-skill-test est un assistant de structuration et de validation pour créer des fichiers de test eval.yaml destinés aux agents dans le dépôt dotnet/skills. Il s’adresse aux personnes qui ont besoin d’un point de départ fiable pour tester une compétence, pas à celles qui veulent simplement une consigne générique du type « rédige un test ». Sa fonction principale est de transformer une compétence cible, un nom de plugin et une idée de scénario en une structure de test conforme aux conventions, avec des fixtures, des assertions et des rubriques moins susceptibles de surajuster le résultat.

La compétence create-skill-test convient surtout aux auteurs qui savent déjà quelle compétence ils veulent évaluer et qui ont besoin d’un moyen rapide de produire un fichier de test respectant les règles du dépôt. Elle est moins utile si votre objectif est seulement d’exécuter des tests, de déboguer des échecs du validateur ou de rédiger des instructions de compétence à partir de zéro.

À quoi sert `create-skill-test`

Utilisez la compétence create-skill-test lorsque vous créez un nouveau fichier d’évaluation, que vous enrichissez un fichier existant avec d’autres scénarios ou que vous vérifiez si votre rubrique est trop spécifique à une seule sortie exacte. Elle est particulièrement utile dans les workflows create-skill-test for Skill Testing, où la qualité de la conception du test compte autant que la forme du YAML.

Ce qu’elle permet d’éviter

Sa principale valeur est d’éviter les évaluations fragiles : champs obligatoires manquants, chemins de compétence incohérents, mauvaise organisation des fixtures et formulation de la rubrique qui récompense par erreur une tournure plutôt qu’un vrai comportement. C’est important si vous voulez des tests qui restent utiles au fil de l’évolution de la compétence cible.

Ce qu’elle ne remplace pas

Elle ne remplace pas le validateur de compétence et ne sert pas à modifier des fichiers SKILL.md. Si votre but est de diagnostiquer une exécution de test cassée ou de déboguer la sortie du validateur, ce n’est pas le bon outil.

Comment utiliser la compétence `create-skill-test`

Installer et ouvrir la compétence source

Installez create-skill-test avec npx skills add dotnet/skills --skill create-skill-test. Puis lisez d’abord SKILL.md, car il contient le workflow, les entrées requises et les limites qui déterminent si votre demande est valide avant même de demander au modèle de générer quoi que ce soit.

Donner à la compétence le bon brief de test

Une bonne demande create-skill-test install ne se résume pas à « fais un test ». Indiquez le nom de la compétence, le nom du plugin, le comportement à vérifier et les contraintes du scénario. La compétence attend des entrées telles que la compétence cible dans plugins/<plugin>/skills/, donc la précision des noms est essentielle.

Un meilleur brief ressemble à ceci :

Skill: foo-bar
Plugin: dotnet-msbuild
Goal: verify that the agent creates a valid summary and rejects unsupported paths
Scenario: first-time user with partial context
Fixture need: one minimal input file and one edge-case file

Cela donne au flux create-skill-test usage suffisamment de structure pour construire une évaluation utile plutôt qu’une évaluation générique.

Lire les sections du dépôt qui comptent

Commencez par SKILL.md, puis examinez, s’ils existent, les fichiers README.md, AGENTS.md, metadata.json et les dossiers voisins rules/, resources/, references/ ou scripts/. Dans cet instantané du dépôt, seul SKILL.md est exposé ; la définition de la compétence est donc la principale source de vérité.

Itérer sur les scénarios et les rubriques

Servez-vous de la première version pour vérifier si le test mesure réellement le comportement recherché. Si la rubrique récompense la formulation plutôt que le résultat, resserrez-la. Si le scénario est trop large, découpez-le. Si la compétence n’a besoin que d’un seul chemin nominal, gardez l’évaluation légère au lieu d’inventer des cas supplémentaires.

FAQ sur la compétence `create-skill-test`

`create-skill-test` est-elle réservée à `dotnet/skills` ?

Oui, elle est conçue autour des conventions du dépôt dotnet/skills et de l’organisation plugins/<plugin>/skills/. Vous pouvez adapter l’idée ailleurs, mais le guide create-skill-test est surtout utile lorsque votre dépôt suit la même structure et les mêmes attentes de validation.

Dois-je l’utiliser à la place d’une requête classique ?

Utilisez create-skill-test lorsque vous voulez une structure d’évaluation reproductible, avec moins d’erreurs de forme. Une requête classique peut décrire un test, mais elle sera généralement moins solide sur les conventions propres au dépôt, le placement des fixtures et les vérifications de surajustement.

Est-ce adapté aux débutants ?

Oui, si vous pouvez identifier la compétence cible et décrire le scénario en termes simples. En revanche, ce ne l’est pas si vous ne pouvez pas nommer le plugin, le chemin de la compétence ou le comportement testé, car ce sont ces informations qui guident la sortie générée.

Quand ne faut-il pas l’utiliser ?

N’utilisez pas create-skill-test pour exécuter des tests, déboguer des erreurs du validateur ou écrire une nouvelle compétence. Ce sont des workflows voisins, mais avec des outils et des critères de réussite différents.

Comment améliorer la compétence `create-skill-test`

Donner des entrées plus ciblées

Les meilleurs résultats de create-skill-test viennent de scénarios précis, pas d’intentions vagues. « Tester que la compétence gère un contexte manquant et renvoie un repli sûr » est plus fort que « créer une évaluation complète », parce que cela indique clairement quel comportement compte et ce qu’il ne faut pas survaloriser.

Demander de la qualité de rubrique, pas seulement du YAML

Si vous ne demandez que la structure, vous pouvez obtenir un fichier techniquement valide mais toujours surajusté. Dites ce qui doit compter comme réussite, ce qui doit échouer et quels détails ne sont que secondaires. C’est le moyen le plus rapide d’améliorer les résultats de create-skill-test for Skill Testing.

Vérifier le surajustement après génération

Vérifiez si les assertions récompensent une formulation unique, un ordre fixe ou une chaîne d’exemple exacte, sauf si ce niveau de précision est réellement nécessaire. Une bonne évaluation mesure le comportement que la compétence doit préserver, pas la formulation exacte produite lors d’une seule exécution.

Affiner à partir des retours du validateur

Si la première sortie échoue à la validation, renvoyez l’erreur exacte avec l’extrait YAML concerné. Cela produit généralement une meilleure deuxième tentative que le simple fait de reformuler toute la demande.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

skill-creator

par anthropics

skill-creator est une méta-skill de création de skills pour rédiger de nouvelles skills, réviser des fichiers SKILL.md, lancer des évaluations, comparer des variantes et améliorer les descriptions de déclenchement avec les scripts du dépôt et des outils de revue.

Skill Authoring

Favoris 2GitHub 105.1k

cpp-testing

par affaan-m

La skill cpp-testing vous aide à écrire, exécuter et déboguer des tests C++ avec GoogleTest, GoogleMock, CMake et CTest. Utilisez-la pour la couverture, la correction de tests instables, le diagnostic avec sanitizers et l’usage concret de cpp-testing dans les projets C++ modernes.

Test Automation

Favoris 0GitHub 156.1k

test-driven-development

par addyosmani

Le skill test-driven-development vous aide à modifier du code en écrivant d’abord un test qui échoue, puis en appliquant le correctif minimal pour le faire passer. Utilisez-le pour les changements de logique, les corrections de bogues, les régressions et les cas limites, quand la preuve compte plus qu’un correctif plausible.

Skill Testing

Favoris 0GitHub 18.8k

skill-optimizer

par mcollina

skill-optimizer aide les auteurs à améliorer des skills IA en matière d’activation, de clarté et de fiabilité entre modèles. Utilisez-le pour la Skill Authoring lorsqu’un skill est rédigé mais pas suivi de façon fiable, lorsque les déclencheurs sont faibles, que des régressions apparaissent ou qu’il faut réduire le coût en contexte. Il prend en charge les boucles de benchmark, les garde-fous de release et un meilleur respect d’usage.

Skill Authoring

Favoris 0GitHub 1.8k

property-based-testing

par trailofbits

Guide du skill property-based-testing pour écrire, relire et améliorer des tests PBT dans plusieurs langages et pour les smart contracts. Utilisez ce guide property-based-testing pour repérer les cas de roundtrip, d’idempotence, d’invariants, de parseurs, de validateurs et de normalisation, choisir des générateurs et décider quand le property-based-testing est plus pertinent que des tests basés sur des exemples.

Skill Testing

Favoris 0GitHub 5k

writing-skills

par obra

writing-skills est un guide de Skill Authoring pour créer, modifier et valider des agent skills avec une approche pilotée par les tests. Découvrez les fichiers clés, les prérequis et les étapes concrètes pour les scénarios de pression, les tests de référence et l’itération concise de `SKILL.md`.

Skill Authoring

Favoris 0GitHub 121.9k

verification-loop

par affaan-m

verification-loop est un workflow de vérification pour Claude Code qui permet de contrôler les builds, les types, le lint, les tests, la sécurité et les diffs après des modifications de code. Cette skill verification-loop est utile avant les PR et après des refactorings, lorsque vous voulez un guide structuré de post-modification plutôt qu’une invite générique.

Verification

Favoris 0GitHub 156.3k

perl-testing

par affaan-m

perl-testing est un guide pratique pour écrire, exécuter et améliorer des tests Perl avec Test2::V0, Test::More, prove, le mocking, la couverture et le TDD. Utilisez le skill perl-testing pour obtenir des conseils d’installation, des modèles d’utilisation, de l’aide à la migration et un débogage plus rapide des suites en échec.

Skill Testing

Favoris 0GitHub 156.2k

kotlin-testing

par affaan-m

kotlin-testing est un guide pratique pour l’automatisation des tests Kotlin avec Kotest, MockK, les tests de coroutines, les tests basés sur les propriétés et la couverture Kover. Utilisez ce skill kotlin-testing pour suivre un workflow adapté au TDD, écrire des tests unitaires et de composants plus lisibles, et réduire les hésitations lors du mock de dépendances ou des tests de code suspendu.

Test Automation

Favoris 0GitHub 156.2k

eval-harness

par affaan-m

Le skill eval-harness est un cadre d’évaluation formel pour les sessions Claude Code et le développement guidé par l’évaluation. Il vous aide à définir des critères de réussite/échec, à construire des évaluations de capacités et de régression, et à mesurer la fiabilité de l’agent avant de déployer des changements de prompt ou de workflow.

Model Evaluation

Favoris 0GitHub 156.1k

context-budget

par affaan-m

Le skill context-budget audite l’utilisation du contexte de Claude Code à travers les agents, les skills, les règles et les serveurs MCP. Il aide à repérer le gonflement, les doublons et les composants coûteux, puis renvoie des actions de nettoyage priorisées. Utilisez ce guide context-budget pour un usage pratique du budget de contexte et pour les tests de skill dans les configurations plus importantes.

Skill Testing

Favoris 0GitHub 156.1k

skill-judge

par softaworks

skill-judge est un skill de revue et de scoring conçu pour auditer des packages de skills IA et des fichiers SKILL.md. Il aide les auteurs et les mainteneurs à évaluer l’écart de connaissance, la clarté d’activation, la qualité du workflow et le niveau de préparation à la publication, avec des pistes d’amélioration concrètes.

Skill Validation

Favoris 0GitHub 1.3k

playwright-testing

par alinaqi

playwright-testing pour écrire et déboguer des tests end-to-end Playwright avec des page objects, des exécutions multi-navigateurs, une configuration adaptée au CI, la gestion de l’authentification et une structure de test stable.

Skill Testing

Favoris 0GitHub 607

darwin-skill

par alchaincyf

darwin-skill aide à améliorer les fichiers SKILL.md grâce à une boucle reproductible : évaluer, réviser, tester, puis conserver ou annuler les changements. Conçu pour le Skill Authoring, il combine un scoring par grille d’évaluation avec une validation basée sur des prompts et prend en charge des sorties visuelles à partir de modèles et d’assets du dépôt.

Skill Authoring

Favoris 0GitHub 549

evaluation

par muratcankoylan

Le skill d’évaluation vous aide à concevoir et à exécuter des évaluations d’agents pour des systèmes non déterministes. Utilisez-le pour planifier l’installation des évaluations, définir des grilles de notation, effectuer des contrôles de régression, mettre en place des garde-fous qualité et réaliser des évaluations pour le test de skills. Il convient aux workflows LLM-as-judge, au scoring multidimensionnel et aux usages d’évaluation concrets lorsque vous avez besoin de résultats reproductibles.

Skill Testing

Favoris 0GitHub 0

tutor

par RoundTable02

tutor est une skill d’étude guidée par quiz pour les utilisateurs d’Obsidian StudyVault qui veulent des évaluations diagnostiques, une révision au niveau des concepts et un suivi des progrès. Il détecte la langue, repère le coffre, lit le tableau de bord et renforce les points faibles au fil de sessions structurées. Utilisez tutor quand vous avez besoin de contrôles d’apprentissage répétables, plutôt que d’un simple tutoriel de chat générique.

Skill Authoring

Favoris 0GitHub 0

create-skill-test

Aperçu de la compétence create-skill-test

À quoi sert create-skill-test

Ce qu’elle permet d’éviter

Ce qu’elle ne remplace pas

Comment utiliser la compétence create-skill-test

Installer et ouvrir la compétence source

Donner à la compétence le bon brief de test

Lire les sections du dépôt qui comptent

Itérer sur les scénarios et les rubriques

FAQ sur la compétence create-skill-test

create-skill-test est-elle réservée à dotnet/skills ?

Dois-je l’utiliser à la place d’une requête classique ?

Est-ce adapté aux débutants ?

Quand ne faut-il pas l’utiliser ?

Comment améliorer la compétence create-skill-test

Donner des entrées plus ciblées

Demander de la qualité de rubrique, pas seulement du YAML

Vérifier le surajustement après génération

Affiner à partir des retours du validateur

Notes et avis

Aperçu de la compétence `create-skill-test`

À quoi sert `create-skill-test`

Comment utiliser la compétence `create-skill-test`

FAQ sur la compétence `create-skill-test`

`create-skill-test` est-elle réservée à `dotnet/skills` ?

Comment améliorer la compétence `create-skill-test`