Skill Validation

Explore agent skills de Skill Validation em Criacao de Skills e compare workflows, ferramentas e casos de uso relacionados.

31 skills

springboot-verification

por affaan-m

springboot-verification é um loop de verificação para projetos Spring Boot que ajuda a confirmar se uma mudança é segura antes de abrir um PR ou fazer deploy. Use este guia da springboot-verification para validação de build, análise estática, testes com cobertura, varreduras de segurança e Skill Validation.

Skill Validation

Favoritos 0GitHub 156.3k

santa-method

por affaan-m

santa-method é um fluxo de verificação multiagente para resultados que precisam estar certos antes de serem publicados. Ele usa revisão independente para identificar pontos cegos em conteúdo, entregáveis próximos de código, textos sensíveis a compliance e tarefas de automação de workflows. Instale a skill santa-method quando precisar de um ciclo repetível de gerar, verificar e convergir.

Workflow Automation

Favoritos 0GitHub 156.2k

rules-distill

por affaan-m

O rules-distill é uma skill de manutenção para autores de skills e curadores de bibliotecas de prompts. Ela varre as skills instaladas, identifica padrões recorrentes e os consolida em regras reutilizáveis, ajudando você a acrescentar, revisar ou criar arquivos de regras com bem menos tentativa e erro do que um prompt genérico de revisão.

Skill Authoring

Favoritos 0GitHub 156.2k

eval-harness

por affaan-m

A skill eval-harness é um framework formal de avaliação para sessões do Claude Code e desenvolvimento orientado por avaliação. Ela ajuda você a definir critérios de aprovação e reprovação, criar avaliações de capacidade e regressão e medir a confiabilidade do agente antes de publicar mudanças em prompts ou fluxos de trabalho.

Model Evaluation

Favoritos 0GitHub 156.1k

continuous-learning-v2

por affaan-m

continuous-learning-v2 transforma sessões do Claude Code em aprendizado por projeto com hooks, agentes observadores, pontuação de confiança e promoção de padrões recorrentes para skills, comandos ou agentes.

Skill Authoring

Favoritos 0GitHub 156.1k

context-budget

por affaan-m

A skill context-budget audita o uso de contexto no Claude Code em agentes, skills, regras e servidores MCP. Ela ajuda a identificar excesso, conteúdo duplicado e componentes de alto custo, e depois retorna ações de limpeza priorizadas. Use este guia de context-budget para entender o uso prático da skill e aplicar Skill Testing em ambientes maiores.

Skill Testing

Favoritos 0GitHub 156.1k

agent-sort

por affaan-m

agent-sort é uma skill sensível ao repositório para montar um plano de instalação de ECC baseado em evidências. Ela ajuda a separar skills, comandos, regras, hooks e extras entre DAILY e LIBRARY, para que você instale apenas o que o projeto realmente usa. Use a skill agent-sort para decidir instalações, entender o uso do agent-sort e seguir um guia prático do agent-sort em fluxos de Skill Authoring.

Skill Authoring

Favoritos 0GitHub 156k

writing-skills

por obra

writing-skills é um guia de Skill Authoring para criar, editar e validar skills de agentes com um fluxo orientado por testes. Entenda os arquivos principais, os pré-requisitos e as etapas práticas para cenários de pressão, testes de linha de base e iteração concisa de `SKILL.md`.

Skill Authoring

Favoritos 0GitHub 121.9k

verification-before-completion

por obra

verification-before-completion é uma skill de checagem final que impede afirmações de conclusão sem respaldo. Veja quando usar, como instalar a partir de obra/superpowers e como vincular cada status informado a evidências recentes de verificação.

Skill Validation

Favoritos 0GitHub 121.9k

skill-creator

por anthropics

skill-creator é uma meta-skill de criação de Skills para rascunhar novas skills, revisar arquivos SKILL.md, rodar evals, comparar variantes e melhorar descrições de trigger com scripts e ferramentas de revisão do repositório.

Skill Authoring

Favoritos 2GitHub 105.1k

evaluation-methodology

por wshobson

A skill evaluation-methodology explica a pontuação PluginEval para Model Evaluation, incluindo camadas, rubricas, pontuação composta, limites de badges e orientações práticas para interpretar resultados e melhorar dimensões fracas.

Model Evaluation

Favoritos 0GitHub 32.6k

context-degradation

por muratcankoylan

context-degradation é uma skill prática para diagnosticar falhas de contexto em fluxos longos, incluindo lost-in-the-middle, poisoning, distraction, confusion e clash. Use-a para identificar onde o contexto quebra, decidir o que mudar primeiro e aplicar um guia repetível de context-degradation para Skill Authoring, posicionamento de prompts e depuração de agentes em produção.

Skill Authoring

Favoritos 0GitHub 15.6k

context-fundamentals

por muratcankoylan

context-fundamentals é um guia prático de engenharia de contexto para sistemas de agentes de IA. Ele ajuda você a decidir o que deve entrar no prompt, depurar problemas de contexto e gerenciar orçamentos de tokens com uma estrutura de contexto mais clara. Use esta skill context-fundamentals quando precisar de um guia bem fundamentado para design de agentes e otimização de prompts.

Context Engineering

Favoritos 0GitHub 15.6k

skill-builder

por yusufkaraaslan

O skill-builder ajuda autores de skills a transformar docs, repositórios GitHub, PDFs, vídeos e bases de código em skills prontas para IA com o Skill Seekers. Ele inclui detecção do tipo de fonte, um fluxo de trabalho recomendado e etapas baseadas em ferramentas para criar skills de forma repetível, em vez de depender de prompts pontuais.

Skill Authoring

Favoritos 0GitHub 13.5k

testing-handbook-generator

por trailofbits

testing-handbook-generator é um meta-skill para criar skills do Claude Code a partir do Trail of Bits Testing Handbook (appsec.guide). Ele ajuda autores de skills, engenheiros de segurança e mantenedores a transformar seções do handbook em skills reutilizáveis, com fluxo de trabalho claro, controle de escopo e geração repetível. Use o skill testing-handbook-generator quando precisar de um guia de testing-handbook-generator para autoria de handbook para skill.

Skill Authoring

Favoritos 0GitHub 5k

audit-prep-assistant

por trailofbits

O audit-prep-assistant prepara codebases para Auditoria de Segurança usando a checklist da Trail of Bits. Ele ajuda a definir objetivos de revisão, executar análise estática, aumentar a cobertura de testes, remover código morto, documentar riscos e gerar artefatos de apoio para uma transição mais limpa para a auditoria.

Security Audit

Favoritos 0GitHub 4.9k

create-skill-test

por dotnet

A skill create-skill-test cria arquivos de teste `eval.yaml` para skills de agente em `dotnet/skills`. Use-a para criar testes de skill, definir cenários, fixtures, assertions e rubricas, e reduzir o overfitting no desenho de avaliações. Ela não serve para executar testes existentes, depurar erros do validador ou escrever arquivos `SKILL.md`.

Skill Testing

Favoritos 0GitHub 3k

create-skill

por dotnet

create-skill é um gerador de scaffold para novas skills de agente no estilo dotnet/skills. Use-o para criar uma pasta de skill válida, gerar um `SKILL.md` com frontmatter e seguir as convenções do repositório para Skill Scaffolding. É mais indicado para skills novas, não para editar as existentes.

Skill Scaffolding

Favoritos 0GitHub 3k

skill-optimizer

por mcollina

O skill-optimizer ajuda autores a melhorar skills de IA em ativação, clareza e confiabilidade entre modelos. Use em Skill Authoring quando uma skill está escrita, mas não é seguida de forma confiável; quando os gatilhos são fracos, aparecem regressões ou é preciso reduzir o custo de contexto. Ele dá suporte a ciclos de benchmark, gates de release e maior fidelidade de uso.

Skill Authoring

Favoritos 0GitHub 1.8k

skill-judge

por softaworks

skill-judge é uma skill de revisão e pontuação para auditar pacotes de skills de IA e arquivos SKILL.md. Ela ajuda autores e mantenedores a avaliar delta de conhecimento, clareza de ativação, qualidade do workflow e prontidão para publicação, com orientações práticas de melhoria.

Skill Validation

Favoritos 0GitHub 1.3k

judge

por NeoLabHQ

Judge é uma skill de avaliação em duas fases que primeiro aciona um meta-judge e depois um subagente judge para pontuar o trabalho com contexto isolado, evidências e critérios claros. Use-a para revisões apenas com relatório de código, textos, análises ou Skill Authoring quando você precisar de um guia de julgamento defensável, e não de uma opinião casual.

Skill Authoring

Favoritos 0GitHub 982

do-and-judge

por NeoLabHQ

A skill do-and-judge executa uma única tarefa com uma etapa de implementação por subagente, um juiz independente e verificação com tentativas repetidas até passar ou até atingir o máximo de tentativas. Use do-and-judge para automação de workflows quando precisar de critérios claros de aceitação, execução isolada e menos chute do que em um prompt genérico.

Workflow Automation

Favoritos 0GitHub 982

llm-patterns

por alinaqi

O llm-patterns ajuda você a desenhar a lógica de aplicativos AI-first, em que os LLMs cuidam do raciocínio, da extração e da geração, enquanto o código fica com validação, roteamento e tratamento de erros. Use a skill llm-patterns para uma estrutura de prompt mais clara, fluxos de trabalho de LLM testáveis e orientação prática para criação de Skills.

Skill Authoring

Favoritos 0GitHub 607

darwin-skill

por alchaincyf

darwin-skill ajuda a melhorar arquivos SKILL.md com um ciclo repetível: avaliar, revisar, testar e então manter ou reverter as mudanças. Criado para Skill Authoring, ele combina pontuação por rubric com validação baseada em prompts e oferece suporte a saídas visuais geradas a partir de templates e assets do repositório.

Skill Authoring

Favoritos 0GitHub 549