Skill Validation

Explora agent skills de Skill Validation en Creacion de Skills y compara workflows, herramientas y casos de uso relacionados.

31 skills

springboot-verification

por affaan-m

springboot-verification es un bucle de verificación para proyectos Spring Boot que te ayuda a confirmar que un cambio es seguro antes de un PR o un despliegue. Usa esta guía de springboot-verification para validación de compilación, análisis estático, pruebas con cobertura, escaneos de seguridad y Skill Validation.

Skill Validation

Favoritos 0GitHub 156.3k

santa-method

por affaan-m

santa-method es un flujo de trabajo de verificación multiagente para resultados que deben salir bien antes de publicarse. Usa revisión independiente para detectar puntos ciegos en contenido, entregables cercanos a código, textos sensibles por cumplimiento y tareas de automatización de flujos de trabajo. Instala la skill santa-method cuando necesites un ciclo repetible de generar, verificar y converger.

Workflow Automation

Favoritos 0GitHub 156.2k

rules-distill

por affaan-m

rules-distill es una skill de mantenimiento para autores de Skills y curadores de bibliotecas de prompts. Examina las skills instaladas, destila patrones repetidos en reglas reutilizables y te ayuda a añadir, revisar o crear archivos de reglas con menos conjeturas que un prompt de revisión genérico.

Skill Authoring

Favoritos 0GitHub 156.2k

eval-harness

por affaan-m

La skill eval-harness es un marco formal de evaluación para sesiones de Claude Code y el desarrollo guiado por evals. Te ayuda a definir criterios de aprobado/reprobado, crear evals de capacidad y de regresión, y medir la fiabilidad del agente antes de publicar cambios en prompts o flujos de trabajo.

Model Evaluation

Favoritos 0GitHub 156.1k

continuous-learning-v2

por affaan-m

continuous-learning-v2 convierte las sesiones de Claude Code en aprendizaje por proyecto con hooks, agentes observadores, puntuación de confianza y promoción de patrones repetidos a skills, comandos o agentes.

Skill Authoring

Favoritos 0GitHub 156.1k

context-budget

por affaan-m

La skill context-budget audita el uso de contexto de Claude Code en agentes, skills, reglas y servidores MCP. Ayuda a identificar bloat, contenido duplicado y componentes de alto costo, y luego devuelve acciones de limpieza priorizadas. Usa esta guía de context-budget para una aplicación práctica del presupuesto de contexto y para pruebas de skills en configuraciones más grandes.

Skill Testing

Favoritos 0GitHub 156.1k

agent-sort

por affaan-m

agent-sort es una skill consciente del repositorio para elaborar un plan de instalación de ECC respaldado por evidencias. Ayuda a clasificar skills, comandos, reglas, hooks y extras en los grupos DAILY y LIBRARY, para que instales solo lo que el proyecto realmente usa. Usa la skill agent-sort para decidir instalaciones, para comprender el uso de agent-sort y como guía práctica de agent-sort en flujos de trabajo de creación de skills.

Skill Authoring

Favoritos 0GitHub 156k

writing-skills

por obra

writing-skills es una guía de Skill Authoring para crear, editar y validar skills de agentes con un flujo de trabajo guiado por pruebas. Explica los archivos clave, los requisitos previos y los pasos prácticos para escenarios de presión, pruebas base e iteración concisa de `SKILL.md`.

Skill Authoring

Favoritos 0GitHub 121.9k

verification-before-completion

por obra

verification-before-completion es una skill de verificación final que evita afirmaciones de cierre sin respaldo. Descubre cuándo usarla, cómo instalarla desde obra/superpowers y cómo vincular cada estado reportado con evidencia de verificación reciente.

Skill Validation

Favoritos 0GitHub 121.9k

skill-creator

por anthropics

skill-creator es una metahabilidad de creación de Skills para redactar nuevas skills, revisar archivos SKILL.md, ejecutar evaluaciones, comparar variantes y mejorar descripciones de activación con scripts del repositorio y herramientas de revisión.

Skill Authoring

Favoritos 2GitHub 105.1k

evaluation-methodology

por wshobson

La skill evaluation-methodology explica la puntuación PluginEval para Model Evaluation, incluidas las capas, las rúbricas, la puntuación compuesta, los umbrales de insignias y la orientación práctica para interpretar resultados y mejorar las dimensiones más débiles.

Model Evaluation

Favoritos 0GitHub 32.6k

context-degradation

por muratcankoylan

context-degradation es una skill práctica para diagnosticar fallos de contexto en flujos de trabajo largos, incluyendo lost-in-the-middle, poisoning, distraction, confusion y clash. Úsala para identificar dónde se rompe el contexto, decidir qué cambiar primero y aplicar una guía repetible de context-degradation para Skill Authoring, la colocación de prompts y la depuración de agentes en producción.

Skill Authoring

Favoritos 0GitHub 15.6k

context-fundamentals

por muratcankoylan

context-fundamentals es una guía práctica de ingeniería de contexto para sistemas de agentes de IA. Te ayuda a decidir qué debe ir en el prompt, depurar problemas de contexto y gestionar mejor los presupuestos de tokens con una estructura de contexto más clara. Usa esta skill de context-fundamentals cuando necesites una guía sólida sobre context-fundamentals para diseño de agentes y optimización de prompts.

Context Engineering

Favoritos 0GitHub 15.6k

skill-builder

por yusufkaraaslan

skill-builder ayuda a los autores de skills a convertir documentación, repos de GitHub, PDFs, videos y codebases en skills listas para IA con Skill Seekers. Incluye detección del tipo de fuente, un flujo de trabajo recomendado y pasos basados en herramientas para crear skills de forma repetible, en lugar de depender de prompts puntuales.

Skill Authoring

Favoritos 0GitHub 13.5k

testing-handbook-generator

por trailofbits

testing-handbook-generator es un meta-skill para crear skills de Claude Code a partir del Trail of Bits Testing Handbook (appsec.guide). Ayuda a autores de skills, ingenieros de seguridad y mantenedores a convertir secciones del handbook en skills reutilizables con un flujo de trabajo claro, control de alcance y generación repetible. Usa el skill testing-handbook-generator cuando necesites una guía de testing-handbook-generator para crear skills a partir de un handbook.

Skill Authoring

Favoritos 0GitHub 5k

audit-prep-assistant

por trailofbits

audit-prep-assistant prepara bases de código para una auditoría de seguridad usando la checklist de Trail of Bits. Ayuda a definir objetivos de revisión, ejecutar análisis estático, aumentar la cobertura de pruebas, eliminar código muerto, documentar riesgos y generar artefactos de apoyo para una entrega de auditoría más ordenada.

Security Audit

Favoritos 0GitHub 4.9k

create-skill-test

por dotnet

create-skill-test genera la estructura inicial de archivos de prueba `eval.yaml` para skills de agente en `dotnet/skills`. Úsalo para crear pruebas de skills, definir escenarios, fixtures, aserciones y rúbricas, y reducir el sobreajuste en el diseño de evaluaciones. No sirve para ejecutar pruebas existentes, depurar errores del validador ni redactar archivos `SKILL.md`.

Skill Testing

Favoritos 0GitHub 3k

create-skill

por dotnet

create-skill es un generador de andamiaje para nuevas skills de agentes, al estilo de dotnet/skills. Úsalo para crear una carpeta de skill válida, generar `SKILL.md` con frontmatter y seguir las convenciones del repositorio para el andamiaje de skills. Es mejor para skills nuevas, no para editar las existentes.

Skill Scaffolding

Favoritos 0GitHub 3k

skill-optimizer

por mcollina

skill-optimizer ayuda a los autores a mejorar skills de IA para aumentar la activación, la claridad y la fiabilidad entre modelos. Úsalo en Skill Authoring cuando un skill está escrito pero no se sigue de forma consistente, cuando los disparadores son débiles, aparecen regresiones o hace falta reducir el coste de contexto. Da soporte a ciclos de benchmark, controles de salida y una mayor fidelidad de uso.

Skill Authoring

Favoritos 0GitHub 1.8k

skill-judge

por softaworks

skill-judge es una skill de revisión y puntuación para auditar paquetes de skills de IA y archivos `SKILL.md`. Ayuda a autores y mantenedores a evaluar la diferencia de conocimiento, la claridad de activación, la calidad del flujo de trabajo y la preparación para publicar, con orientación práctica para mejorar.

Skill Validation

Favoritos 0GitHub 1.3k

judge

por NeoLabHQ

Judge es una skill de evaluación en dos fases que primero activa un meta-juez y luego un subagente juez para puntuar el trabajo con contexto aislado, evidencia y criterios claros. Úsala para revisiones solo con informe de código, redacción, análisis o Skill Authoring cuando necesites una guía de juez defendible en lugar de una opinión informal.

Skill Authoring

Favoritos 0GitHub 982

do-and-judge

por NeoLabHQ

La skill do-and-judge ejecuta una sola tarea con un paso de implementación de subagente, un juez independiente y verificación basada en reintentos hasta que pasa o se alcanza el máximo de reintentos. Usa do-and-judge para automatización de flujos cuando necesites criterios de aceptación claros, ejecución aislada y menos improvisación que con un prompt genérico.

Workflow Automation

Favoritos 0GitHub 982

llm-patterns

por alinaqi

llm-patterns te ayuda a diseñar la lógica de aplicaciones AI-first, donde los LLM se encargan del razonamiento, la extracción y la generación, mientras el código se ocupa de la validación, el enrutamiento y el manejo de errores. Usa la skill llm-patterns para una estructura de prompts más clara, flujos de trabajo de LLM que se pueden probar y orientación práctica para la creación de skills.

Skill Authoring

Favoritos 0GitHub 607

darwin-skill

por alchaincyf

darwin-skill ayuda a mejorar archivos SKILL.md con un ciclo repetible: evaluar, revisar, probar y luego conservar o revertir los cambios. Pensado para Skill Authoring, combina puntuación con una rúbrica y validación basada en prompts, y admite resultados visuales a partir de plantillas y recursos del repositorio.

Skill Authoring

Favoritos 0GitHub 549