Model Evaluation

Explora agent skills de Model Evaluation en Seguridad y compara workflows, herramientas y casos de uso relacionados.

3 skills
W
evaluation-methodology

by wshobson

La skill evaluation-methodology explica la puntuación PluginEval para Model Evaluation, incluidas las capas, las rúbricas, la puntuación compuesta, los umbrales de insignias y la orientación práctica para interpretar resultados y mejorar las dimensiones más débiles.

Model Evaluation
Favorites 0GitHub 32.6k
W
llm-evaluation

by wshobson

Usa la skill llm-evaluation para diseñar planes de evaluación repetibles para apps con LLM, prompts, sistemas RAG y cambios de modelo, con métricas, revisión humana, benchmarking y controles de regresión.

Model Evaluation
Favorites 0GitHub 32.6k
W
ml-pipeline-workflow

by wshobson

ml-pipeline-workflow es una guía práctica para diseñar pipelines MLOps de extremo a extremo para preparación de datos, entrenamiento, validación, despliegue y monitorización, con patrones de orquestación para automatizar flujos de trabajo repetibles.

Workflow Automation
Favorites 0GitHub 0