D

create-skill-test

por dotnet

create-skill-test genera la estructura inicial de archivos de prueba `eval.yaml` para skills de agente en `dotnet/skills`. Úsalo para crear pruebas de skills, definir escenarios, fixtures, aserciones y rúbricas, y reducir el sobreajuste en el diseño de evaluaciones. No sirve para ejecutar pruebas existentes, depurar errores del validador ni redactar archivos `SKILL.md`.

Estrellas3k
Favoritos0
Comentarios0
Agregado25 may 2026
CategoríaSkill Testing
Comando de instalación
npx skills add dotnet/skills --skill create-skill-test
Puntuación editorial

Esta skill obtiene 62/100, así que se puede listar, pero conviene usarla con cautela: ofrece a los usuarios del directorio un flujo de trabajo real y específico para estructurar archivos de prueba `eval.yaml`, aunque es más limitada y más dependiente del repositorio que una skill de uso más general.

62/100
Puntos fuertes
  • Activación clara: el frontmatter indica que debe usarse para crear archivos de prueba `eval.yaml`, añadir escenarios, preparar fixtures y revisar el riesgo de sobreajuste.
  • Flujo de trabajo operativo y concreto: el cuerpo incluye entradas explícitas, pautas de cuándo usarla y cuándo no, y un proceso de varios pasos con restricciones.
  • Buen valor para decidir la instalación en colaboradores de `dotnet/skills`: referencia comprobaciones del validador y convenciones del repositorio, lo que reduce la ambigüedad frente a un prompt genérico.
Puntos a tener en cuenta
  • Es experimental y está orientada a pruebas, además de limitada a las convenciones de `dotnet/skills`, por lo que puede no trasladarse bien fuera de ese repositorio.
  • No incluye scripts, referencias ni archivos de soporte, así que el usuario debe apoyarse solo en el documento para los detalles de implementación.
Resumen

Descripción general de la skill create-skill-test

create-skill-test es un asistente de andamiaje y validación para construir archivos de prueba eval.yaml para skills de agentes en el repositorio dotnet/skills. Está pensado para quienes necesitan un punto de partida fiable para probar una skill, no como un prompt genérico para “escribe una prueba”. Su función principal es convertir una skill objetivo, el nombre del plugin y una idea de escenario en una estructura de prueba segura según las convenciones, con fixtures, assertions y rúbricas que tienen menos probabilidad de sobreajustarse.

La skill create-skill-test es ideal para autores que ya saben qué skill quieren evaluar y necesitan una forma rápida de producir un archivo de prueba que respete las reglas del repositorio. Es menos útil si solo quieres ejecutar pruebas, depurar fallos del validador o escribir instrucciones de una skill desde cero.

Para qué sirve create-skill-test

Usa la skill create-skill-test cuando estés creando un nuevo archivo eval, ampliando uno existente con más escenarios o comprobando si tu rúbrica es demasiado específica para una única salida exacta. Resulta especialmente útil en flujos de trabajo de create-skill-test for Skill Testing, donde la calidad del diseño de la prueba importa tanto como la forma del YAML.

Qué te ayuda a evitar

Su mayor valor está en evitar evals frágiles: campos obligatorios ausentes, rutas de skill desalineadas, mala organización de fixtures y lenguaje de rúbrica que premia accidentalmente una redacción concreta en lugar del comportamiento real. Eso importa si quieres pruebas que sigan siendo útiles a medida que evoluciona la skill objetivo.

Qué no sustituye

No sustituye al skill-validator, y tampoco ayuda a editar archivos SKILL.md. Si tu objetivo es diagnosticar una ejecución de prueba rota o depurar la salida del validador, esta no es la herramienta adecuada.

Cómo usar la skill create-skill-test

Instala y abre la skill de origen

Instala create-skill-test con npx skills add dotnet/skills --skill create-skill-test. Después, lee primero SKILL.md, porque ahí están el flujo de trabajo, los requisitos de entrada y los límites que determinan si tu solicitud es válida antes de pedirle al modelo que genere nada.

Dale a la skill un briefing de prueba correcto

Una solicitud sólida para create-skill-test install no es solo “haz una prueba”. Incluye el nombre de la skill, el nombre del plugin, el comportamiento que quieres verificar y cualquier restricción del escenario. La skill espera entradas como la skill objetivo dentro de plugins/<plugin>/skills/, así que la precisión al nombrar importa.

Un mejor briefing se vería así:

  • Skill: foo-bar
  • Plugin: dotnet-msbuild
  • Objetivo: verificar que el agente crea un resumen válido y rechaza rutas no admitidas
  • Escenario: usuario primerizo con contexto parcial
  • Necesidad de fixture: un archivo de entrada mínimo y un archivo de caso límite

Eso le da al flujo create-skill-test usage suficiente estructura para construir un eval útil en lugar de uno genérico.

Lee las secciones del repositorio que importan

Empieza con SKILL.md y luego revisa cualquier README.md, AGENTS.md, metadata.json y las carpetas cercanas rules/, resources/, references/ o scripts/ si existen. En esta instantánea del repositorio, SKILL.md es el único archivo expuesto, así que la definición de la skill es la principal fuente de verdad.

Itera sobre escenarios y rúbricas

Usa el primer borrador para comprobar si la prueba realmente mide el comportamiento previsto. Si la rúbrica premia la redacción en lugar del resultado, apriétala. Si el escenario es demasiado amplio, divídelo. Si la skill solo necesita un único camino feliz, mantén el eval pequeño en vez de inventar casos extra.

Preguntas frecuentes sobre la skill create-skill-test

¿create-skill-test es solo para dotnet/skills?

Sí, está diseñada en torno a las convenciones del repositorio dotnet/skills y la estructura plugins/<plugin>/skills/. Puedes adaptar la idea a otros contextos, pero la guía de create-skill-test es mucho más valiosa cuando tu repo sigue la misma estructura y las mismas expectativas de validación.

¿Debería usarla en lugar de un prompt normal?

Usa create-skill-test cuando quieras un andamiaje de eval repetible y con menos errores estructurales. Un prompt normal puede describir una prueba, pero suele ser más débil en convenciones específicas del repositorio, ubicación de fixtures y comprobaciones de sobreajuste.

¿Es apta para principiantes?

Sí, si puedes identificar la skill objetivo y explicar el escenario en lenguaje claro. No es especialmente apta para principiantes si no puedes nombrar el plugin, la ruta de la skill o el comportamiento que se está probando, porque esas entradas determinan la salida generada.

¿Cuándo no debería usarla?

No uses create-skill-test para ejecutar pruebas, depurar errores del validador o crear una skill nueva. Son flujos de trabajo relacionados, pero con herramientas distintas y criterios de éxito distintos.

Cómo mejorar la skill create-skill-test

Aporta entradas más acotadas

Los mejores resultados de create-skill-test vienen de escenarios concretos, no de intenciones amplias. “Probar que la skill maneja la ausencia de contexto y devuelve una respuesta segura de reserva” es más sólido que “crear un eval completo”, porque le dice a la skill qué comportamiento importa y qué no debería sobrepremiar.

Pide calidad de rúbrica, no solo YAML

Si solo pides estructura, puedes obtener un archivo técnicamente válido que aun así se sobreajusta. Indica qué debe contar como éxito, qué debe fallar y qué detalles son accesorios. Esa es la forma más rápida de mejorar los resultados de create-skill-test for Skill Testing.

Revisa el sobreajuste después de generar

Comprueba si las assertions premian una sola redacción, un orden fijo o una cadena de ejemplo exacta, salvo que esa especificidad sea realmente necesaria. Los buenos evals miden el comportamiento que la skill debe preservar, no la redacción exacta producida en una sola ejecución.

Ajusta según la retroalimentación del validador

Si la primera salida falla la validación, devuelve el error exacto y el fragmento de YAML que lo rodea. Normalmente eso produce una segunda pasada mejor que reformular toda la solicitud.

Calificaciones y reseñas

Aún no hay calificaciones
Comparte tu reseña
Inicia sesión para dejar una calificación y un comentario sobre esta skill.
G
0/10000
Reseñas más recientes
Guardando...
Instalación y uso de create-skill-test