skill-creator

par anthropics

skill-creator est une méta-skill de création de skills pour rédiger de nouvelles skills, réviser des fichiers SKILL.md, lancer des évaluations, comparer des variantes et améliorer les descriptions de déclenchement avec les scripts du dépôt et des outils de revue.

Étoiles105.1k

Favoris2

Commentaires0

Ajouté28 mars 2026

CatégorieSkill Authoring

Commande d’installation

npx skills add anthropics/skills --skill skill-creator

Score éditorial

Cette skill obtient la note de 84/100, ce qui en fait une très bonne candidate dans l’annuaire pour les utilisateurs qui recherchent un véritable workflow afin de créer, faire évoluer et évaluer d’autres skills. Le dépôt présente une vraie profondeur opérationnelle — guide en plusieurs étapes, agents d’évaluation et scripts exécutables — ce qui devrait offrir plus de levier à un agent qu’un simple prompt générique. En revanche, il faut prévoir un peu d’interprétation à l’installation, car SKILL.md ne propose ni commande d’installation simple ni guide de démarrage rapide.

95/100

Points forts

Excellente déclenchabilité : la description couvre clairement la création de nouvelles skills, la modification de skills existantes, l’exécution d’évaluations, la comparaison de variantes et l’amélioration des descriptions pour un meilleur déclenchement.
Fort levier opérationnel : le dépôt inclut des outils concrets pour les boucles d’évaluation et la revue, notamment run_eval.py, run_loop.py, aggregate_benchmark.py, package_skill.py et eval-viewer/generate_review.py.
Bonne progression d’information : la documentation dédiée pour les agents analyzer, comparator et grader précise leurs rôles, leurs entrées et les procédures d’évaluation étape par étape.

Points de vigilance

L’adoption n’est pas entièrement clé en main : SKILL.md ne contient ni commande d’installation ni parcours de démarrage rapide concis, donc les utilisateurs devront peut-être déduire comment intégrer les scripts à leur environnement.
Le workflow paraît relativement lourd pour des cas d’usage simples, avec plusieurs scripts, agents et étapes d’évaluation qui peuvent dépasser les besoins de certains utilisateurs.

Anthropic Claude Workflow Testing Documentation

Vue d’ensemble

Vue d’ensemble de la skill skill-creator

Ce que fait skill-creator

skill-creator est une méta-skill dédiée au Skill Authoring : elle vous aide à créer une nouvelle skill, à en réviser une existante et à vérifier si les changements améliorent réellement le comportement. Contrairement à un simple prompt du type « écris-moi une skill », elle s’appuie sur une boucle itérative : rédiger, tester, relire les sorties, comparer des variantes, puis affiner.

À qui s’adresse skill-creator

Le meilleur cas d’usage de skill-creator concerne toutes les personnes chargées de transformer un comportement récurrent d’agent en skill réutilisable :

les auteurs de skills qui partent d’une idée encore floue
les maintainers qui cherchent à améliorer un SKILL.md faible
les équipes qui veulent ajouter des evals avant un déploiement plus large
les personnes qui ajustent les descriptions pour que la bonne skill se déclenche plus fiablement

Si vous avez seulement besoin d’un prompt ponctuel, skill-creator est probablement plus structuré que nécessaire.

Le vrai besoin auquel répond skill-creator

La plupart des utilisateurs n’ont pas seulement besoin d’aide pour rédiger du markdown. Ils ont surtout besoin de réduire la part d’incertitude :

ce que la skill doit contenir
comment recueillir suffisamment de contexte auprès de l’utilisateur
comment tester avec des prompts réalistes
comment relire les sorties de façon qualitative et quantitative
comment itérer sans se laisser tromper par une seule exécution réussie

Cette focalisation sur le workflow est le principal élément différenciant de la skill-creator skill.

Ce qui ressort avant l’installation de skill-creator

Le dépôt est plus solide sur l’évaluation et l’itération que sur le « scaffolding instantané ». Il inclut notamment :

des agents d’assistance orientés évaluation dans agents/
des scripts de benchmark et de reporting dans scripts/
un workflow de revue HTML dans eval-viewer/ et assets/
des éléments de schéma/référence dans references/schemas.md

Cela rend skill-creator particulièrement utile si vous cherchez à mesurer la qualité, et pas seulement à générer un premier brouillon.

Ce qui peut freiner l’adoption de skill-creator

Le principal compromis, c’est la complexité. skill-creator suppose que vous raisonniez par étapes et que vous fournissiez des prompts de test, des attentes et des cibles de comparaison. Si votre environnement ne peut pas exécuter les scripts Python de support, ou si vous ne prévoyez pas d’évaluer les sorties, vous n’exploiterez qu’une partie de la skill.

Comment utiliser la skill skill-creator

Installer skill-creator dans votre environnement de skills

Si vous utilisez le pattern CLI de skills Anthropic, installez-la depuis le dépôt upstream :

npx skills add https://github.com/anthropics/skills --skill skill-creator

Le dépôt ne met pas en avant d’installateur de package séparé dans SKILL.md, donc pour la plupart des utilisateurs, le mieux est de l’ajouter depuis le monorepo puis d’inspecter les fichiers installés localement.

Commencez par lire ces fichiers

Pour vous orienter rapidement, lisez-les dans cet ordre :

skills/skill-creator/SKILL.md
skills/skill-creator/agents/grader.md
skills/skill-creator/agents/comparator.md
skills/skill-creator/agents/analyzer.md
skills/skill-creator/scripts/run_eval.py
skills/skill-creator/scripts/run_loop.py
skills/skill-creator/eval-viewer/generate_review.py
skills/skill-creator/references/schemas.md

Ce parcours montre bien le modèle de fonctionnement réel : générer ou réviser une skill, lancer des evals, comparer les sorties, puis analyser pourquoi une version l’emporte.

Commencez par l’étape où vous en êtes vraiment avec skill-creator

La skill-creator skill ne sert pas uniquement à créer des skills à partir de zéro. Elle donne de meilleurs résultats si vous dites explicitement au modèle à quelle étape vous vous situez :

cadrage de l’idée : « Je comprends le problème, mais pas encore le workflow »
premier brouillon : « Transforme ces notes en SKILL.md exploitable »
correction : « Cette skill existe déjà, mais elle échoue sur ces prompts »
optimisation : « Améliore la description de déclenchement et les exemples »
évaluation : « Conçois des prompts de test et des attentes »
comparaison : « Compare v1 et v2 et explique laquelle gagne »

Si vous sautez cette précision, le modèle risque de consacrer trop d’effort à la mauvaise phase.

Donnez à skill-creator les entrées dont elle a réellement besoin

Un bon prompt de skill-creator usage inclut généralement :

la tâche utilisateur cible
les entrées que la future skill recevra
les sorties ou livrables attendus
les outils/fichiers que la skill pourra lire ou exécuter
les contraintes telles que la latence, le format ou la sécurité
des exemples d’échec que vous avez déjà observés
3 à 10 prompts de test réalistes

Le plus gros saut de qualité vient généralement de meilleurs exemples et de cas d’échec concrets, pas d’une prose plus longue.

Transformer un objectif vague en prompt solide pour skill-creator

Prompt faible :

Help me create a research skill.

Prompt plus solide :

Use skill-creator for Skill Authoring. I need a skill that turns a vague market question into a structured research brief with sources, assumptions, and open questions. Inputs are a user question and optional company context. Outputs should be a markdown brief. The skill may browse repository files but should not invent citations. Current failure modes: overlong answers, weak source framing, and missing assumptions. Please draft the skill, propose 6 eval prompts, and suggest measurable expectations for each.

Cette version est meilleure parce qu’elle précise la tâche, les entrées/sorties, les contraintes et les modes d’échec.

Utilisez le workflow d’évaluation intégré de skill-creator

Les éléments présents dans le dépôt montrent que skill-creator a été conçue pour une évaluation itérative, pas seulement pour rédiger un brouillon. En pratique :

rédigez ou révisez la skill
créez un petit jeu d’evals
exécutez les runs
relisez les transcriptions et les sorties
évaluez les attentes
comparez les variantes à l’aveugle quand c’est utile
révisez à nouveau la skill

Les scripts sous scripts/ donnent une bonne indication du workflow visé :

run_eval.py pour exécuter les evals
aggregate_benchmark.py et generate_report.py pour synthétiser les résultats
run_loop.py pour les cycles d’amélioration répétés
quick_validate.py pour des vérifications plus rapides
improve_description.py pour ajuster la description de déclenchement

Relire les sorties de skill-creator avec la visionneuse HTML

Un différenciateur concret de skill-creator install, c’est l’interface de revue incluse. eval-viewer/generate_review.py crée une page de revue HTML autonome à partir d’un workspace de runs et peut enregistrer du feedback. C’est particulièrement utile quand plusieurs sorties doivent être relues par un humain, surtout pour les skills où la qualité de la transcription et celle des artefacts produits comptent toutes deux.

Si vous hésitez à adopter cette skill, cet outillage de revue est l’un de ses meilleurs arguments.

Utiliser les agents comparator et grader de skill-creator pour itérer avec moins de biais

Deux agents de support ont une vraie valeur :

agents/comparator.md compare des sorties en A/B sans savoir quelle skill les a produites
agents/grader.md vérifie les attentes par rapport aux transcriptions et aux sorties, et critique aussi les assertions trop faibles

Autrement dit, skill-creator ne se contente pas de demander « est-ce que cette sortie a l’air bonne ? », mais aussi « est-ce que nos evals avaient vraiment du sens ? ». C’est particulièrement utile pour une maintenance sérieuse des skills.

Ajustez la description, pas seulement le corps de la skill skill-creator

Beaucoup d’auteurs de skills se concentrent trop sur le contenu des instructions et pas assez sur la description du haut, utilisée pour le déclenchement. La présence de scripts/improve_description.py montre clairement que la qualité du trigger fait partie du workflow prévu. Si une bonne skill n’est pas invoquée de manière assez fiable, améliorez :

la formulation du problème dans la description
les situations où elle doit s’activer
la frontière de ce qu’elle ne doit pas prendre en charge

C’est un usage à fort levier de la skill-creator skill dans une bibliothèque de skills existante.

Connaître les limites pratiques de skill-creator

skill-creator aide à structurer l’écriture et l’évaluation, mais elle ne remplace pas :

la connaissance métier de la tâche ciblée
des cas d’eval réalistes
le jugement humain lorsque les sorties sont subjectives
le support d’exécution nécessaire pour les utilitaires Python inclus

Si vous ne pouvez pas fournir de prompts réalistes ni inspecter les sorties, le processus perd une grande partie de sa valeur.

FAQ sur la skill skill-creator

skill-creator convient-elle aux débutants ?

Oui, avec une réserve : les débutants peuvent s’appuyer sur les workflows skill-creator guide pour éviter de partir d’une page blanche, mais le dépôt complet suppose une certaine aisance avec les tests itératifs. Si vous débutez, commencez par le brouillon et un tout petit jeu d’evals avant de toucher aux scripts de benchmark.

Qu’est-ce qui rend skill-creator meilleure qu’un prompt classique ?

Un prompt classique peut produire un premier brouillon plausible. skill-creator devient meilleure dès que vous avez besoin d’une boucle reproductible de création et d’amélioration, avec un vrai support d’évaluation. Sa valeur tient surtout à la méthode et aux fichiers auxiliaires qui l’entourent, pas uniquement à la rédaction initiale.

Dans quels cas ne pas utiliser skill-creator ?

Mieux vaut la laisser de côté si :

vous avez seulement besoin d’un prompt ponctuel
vous n’avez aucun plan pour tester les sorties
la tâche est trop petite pour justifier une skill
votre environnement ne peut pas utiliser les scripts de support ni le workflow de revue du dépôt

Dans ces cas-là, un prompt direct ira plus vite.

Est-ce que skill-creator aide seulement à créer de nouvelles skills ?

Non. La skill-creator skill convient aussi très bien à la révision de skills existantes, au benchmark de deux versions et à l’amélioration des descriptions pour un meilleur déclenchement.

Faut-il utiliser tous les scripts pour y trouver de la valeur ?

Non. Vous pouvez tout de même utiliser skill-creator usage pour le brouillon et la révision manuelle. Mais ce sont les scripts d’évaluation et la visionneuse qui apportent le plus de gain d’information par rapport à un prompting classique.

Est-ce réservé à l’écosystème de skills d’Anthropic ?

Elle est clairement conçue autour de la structure et de la terminologie de cet écosystème, c’est donc là qu’elle s’intègre le mieux. Cela dit, les principes de workflow — rédiger, évaluer, comparer, réviser — se transfèrent bien à d’autres frameworks internes de skills ou d’agents.

Comment améliorer la skill skill-creator

Définissez des limites de tâche plus étroites pour skill-creator

Le moyen le plus rapide d’améliorer la qualité des sorties de skill-creator, c’est de préciser ce que la future skill doit refuser ou ignorer. Sans frontières claires, les brouillons deviennent souvent trop larges et se déclenchent trop facilement. Incluez dans votre prompt des exemples de « use when » et de « do not use when ».

Fournissez tôt des prompts d’eval réalistes

Beaucoup d’utilisateurs attendent trop longtemps avant de créer des cas de test. Avec skill-creator for Skill Authoring, des prompts d’eval précoces obligent à clarifier la tâche réelle. De bonnes evals doivent refléter de vraies entrées utilisateur, pas des exemples trop propres qui donnent artificiellement l’impression que la skill fonctionne mieux qu’elle ne le fait.

Rédigez des attentes plus solides

Des attentes faibles donnent une fausse impression de confiance. Au lieu de :

“Output is clear”

Utilisez :

“Output includes a prioritized recommendation”
“Every cited claim links to a provided source”
“Result contains assumptions and open questions sections”

Cela correspond bien à la philosophie visible dans agents/grader.md, qui met explicitement en garde contre les assertions satisfaites trop facilement.

Comparez les versions à l’aveugle quand les changements de skill-creator sont subtils

Si vous hésitez entre deux brouillons proches, utilisez le schéma de comparaison à l’aveugle au lieu de juger le markdown à l’œil. De petits changements de formulation peuvent modifier l’exécution de façon difficile à prévoir à partir du seul fichier de skill.

Inspectez les transcriptions, pas seulement les sorties finales

Une réponse finale soignée peut masquer une mauvaise utilisation des outils, des fichiers manqués ou un raisonnement faible. skill-creator devient bien plus utile lorsque vous relisez les transcriptions en parallèle des sorties et que vous cherchez pourquoi une version a réussi, ce qui correspond précisément au rôle de l’agent analyzer.

Améliorez une seule dimension à la fois

Ne réécrivez pas en une fois la description, les instructions, les exemples et les consignes liées aux outils si vous voulez tirer des enseignements fiables. Modifiez une seule dimension, relancez un jeu d’evals stable, puis examinez le delta. Cela rend le processus skill-creator guide beaucoup plus instructif.

Utilisez les fichiers du dépôt comme mode d’emploi opérationnel

Si les résultats vous semblent vagues, ne relisez pas seulement SKILL.md. Lisez aussi les fichiers de support qui définissent le comportement d’évaluation :

agents/comparator.md pour comprendre ce que signifie « mieux » dans des revues A/B
agents/grader.md pour la rigueur pass/fail
agents/analyzer.md pour les enseignements d’amélioration a posteriori
references/schemas.md pour les structures attendues

Ces fichiers clarifient souvent mieux la façon d’utiliser la skill que la description de premier niveau.

Élargissez le jeu d’evals après la première victoire avec skill-creator

Un mode d’échec fréquent consiste à s’arrêter après quelques bonnes exécutions. La skill-creator skill est explicitement conçue pour une montée en charge itérative : une fois que le brouillon fonctionne sur un petit ensemble, élargissez les prompts pour inclure des cas limites, des demandes ambiguës et des exemples riches en échecs. C’est ainsi que vous saurez si la skill est robuste, ou simplement chanceuse.

Notes et avis

Aucune note pour le moment

Partagez votre avis

Connectez-vous pour laisser une note et un commentaire sur cet outil.

0/10000

Derniers avis

Enregistrement...

Autres outils de cette catégorie

create-colleague

par titanwings

create-colleague transforme des documents de collègues, chats, e-mails, captures d’écran, ainsi que des données Feishu et DingTalk, en un skill IA modifiable avec des sorties séparées pour le travail et le persona, ainsi que des flux de mise à jour pour l’améliorer dans la durée.

Skill Authoring

Favoris 1GitHub 747

lean-ux-canvas

par deanpeters

lean-ux-canvas aide les équipes à cadrer un problème métier, faire émerger les hypothèses et définir quoi apprendre ensuite avec Lean UX Canvas v2. À utiliser pour préparer un atelier, aligner les parties prenantes et lancer une découverte produit en amont, quand il faut un guide lean-ux-canvas concret avant de passer à la solution.

Skill Authoring

Favoris 0GitHub 4.1k

documentation-lookup

par affaan-m

documentation-lookup aide les agents à répondre aux questions sur des bibliothèques, des frameworks et des API à partir de la documentation actuelle, plutôt qu’à partir de la mémoire. C’est idéal pour les tâches de mise en route, de configuration, de référence et d’exemples de code lorsque la dernière syntaxe compte. Utilisez le skill documentation-lookup pour Skill Docs lorsqu’une demande dépend d’une documentation en direct et d’indications exactes à la version près.

Skill Docs

Favoris 0GitHub 156.1k

mcp-builder

par anthropics

mcp-builder est un guide pratique pour planifier, créer et évaluer des serveurs MCP pour des API et services externes. Il aide les développeurs à définir le périmètre des outils, le nommage, le transport, les approches Python ou Node, ainsi que les workflows d’évaluation pour un usage fiable par les agents.

MCP Server Development

Favoris 0GitHub 105k

user-story

par deanpeters

La skill user-story vous aide à transformer des besoins produit en une story unique, prête pour le développement, avec le format de Mike Cohn et des critères d’acceptation en Gherkin. Utilisez-la pour des passations plus claires, de meilleures estimations et un guide de user stories plus rigoureux pour les équipes de rédaction technique et produit.

Technical Writing

Favoris 0GitHub 4.1k

user-story-splitting

par deanpeters

Le skill user-story-splitting vous aide à découper de grands épiques et user stories en récits plus petits, livrables de façon autonome, grâce à des patrons structurés. Utilisez-le pour l’estimation, le séquencement, la réduction des risques et les workflows d’authoring de skills lorsqu’un élément de backlog est trop large pour tenir dans un seul sprint.

Skill Authoring

Favoris 0GitHub 0

sanity-best-practices

par sanity-io

Le skill sanity-best-practices vous aide à choisir les bons patterns Sanity avant de construire. Utilisez-le pour les schémas, GROQ, TypeGen, Visual Editing, Portable Text, la localisation, les migrations, Functions, Blueprints et les intégrations frontend comme Next.js, Nuxt, Astro, Remix, SvelteKit, Angular, Hydrogen et l’App SDK.

Frontend Development

Favoris 0GitHub 0

provider-docs

par hashicorp

Le skill provider-docs vous aide à créer, mettre à jour et vérifier la documentation Terraform Registry des providers Terraform. Utilisez-le pour les travaux de guide provider-docs, pour la rédaction technique autour de provider-docs, et pour maintenir la cohérence entre les descriptions de schéma, les templates `tfplugindocs` et la sortie du Registry lorsque la documentation évolue.

Technical Writing

Favoris 0GitHub 0

press-release

par deanpeters

Le skill press-release vous aide à rédiger un communiqué de type Amazon, selon la méthode Working Backwards, avant de construire quoi que ce soit. Utilisez-le pour clarifier la valeur client, tester une idée de produit ou de fonctionnalité, et aligner les parties prenantes autour d’un récit concis, centré sur le client. Utile pour le press-release en rédaction technique et pour la planification produit en phase amont.

Technical Writing

Favoris 0GitHub 4.1k

writing-skills

par obra

writing-skills est un guide de Skill Authoring pour créer, modifier et valider des agent skills avec une approche pilotée par les tests. Découvrez les fichiers clés, les prérequis et les étapes concrètes pour les scénarios de pression, les tests de référence et l’itération concise de `SKILL.md`.

Skill Authoring

Favoris 0GitHub 121.9k

prd-generator

par ognjengt

prd-generator transforme une idée produit approximative en Product Requirements Document prêt pour l’IA. Le skill pose des questions de clarification, suit un modèle fixe et aide les fondateurs, les responsables produit et les workflows de création de skills à produire des spécifications plus claires pour les outils de code IA en aval. Utilisez prd-generator quand vous avez besoin d’exigences structurées, de métriques, de contraintes et d’un contexte prêt pour l’implémentation.

Skill Authoring

Favoris 0GitHub 0

command-creator

par softaworks

command-creator aide à transformer des workflows Claude Code répétitifs en commandes slash réutilisables. Découvrez le bon modèle de commande, rédigez des instructions exécutables par un agent, choisissez entre `.claude/commands/` et `~/.claude/commands/`, et appuyez-vous sur les références incluses pour des exemples et de bonnes pratiques.

Skill Authoring

Favoris 0GitHub 1.3k

altitude-horizon-framework

par deanpeters

altitude-horizon-framework est un skill d’aide à la décision pour la transition de PM à directeur. Utilisez-le pour diagnostiquer les écarts d’altitude et d’horizon, clarifier le périmètre et le calendrier, et appliquer la Cascading Context Map lorsque la stratégie reste floue. Il inclut des indications pratiques d’installation, d’utilisation et d’exemples pour la rédaction de skills.

Skill Authoring

Favoris 0GitHub 4.1k

prompt-optimizer

par affaan-m

prompt-optimizer est une skill prompt-optimizer qui analyse des prompts bruts, repère les éléments de contexte manquants et les réécrit en prompts plus clairs, prêts à être collés. Elle convient particulièrement au travail de guide prompt-optimizer, à la relecture de prompts et à prompt-optimizer pour la rédaction de prompts, surtout quand il faut une structure plus solide pour Claude Code ou des workflows ECC. Elle n’exécute pas la tâche sous-jacente.

Prompt Writing

Favoris 0GitHub 156.2k

continuous-learning-v2

par affaan-m

continuous-learning-v2 transforme les sessions Claude Code en apprentissage par projet, avec des hooks, des agents observateurs, un scoring de confiance et la promotion des motifs récurrents en skills, commandes ou agents.

Skill Authoring

Favoris 0GitHub 156.1k

documentation-and-adrs

par addyosmani

documentation-and-adrs aide les agents à rédiger une documentation technique et des ADR orientés décision. Utilisez-le pour consigner le contexte, les contraintes, les arbitrages, les options écartées et les conséquences pour l’architecture, les API, l’infrastructure, l’authentification et les évolutions de fonctionnalités. Il est idéal lorsque vous avez besoin d’un historique durable des raisons de ces choix pour les futurs ingénieurs et agents, pas seulement d’un résumé soigné.

Technical Writing

Favoris 0GitHub 18.7k