Model Evaluation

Explorez les agent skills lies a Model Evaluation dans Securite et comparez les workflows, outils et cas d usage associes.

3 skills
W
evaluation-methodology

by wshobson

La compétence evaluation-methodology explique le scoring PluginEval pour Model Evaluation, avec les couches d’évaluation, les rubrics, le score composite, les seuils de badges et des conseils pratiques pour interpréter les résultats et améliorer les dimensions faibles.

Model Evaluation
Favorites 0GitHub 32.6k
W
llm-evaluation

by wshobson

Utilisez le skill llm-evaluation pour concevoir des plans d’évaluation reproductibles pour les applications LLM, les prompts, les systèmes RAG et les changements de modèle, avec des métriques, de la revue humaine, du benchmarking et des vérifications de régression.

Model Evaluation
Favorites 0GitHub 32.6k
W
ml-pipeline-workflow

by wshobson

ml-pipeline-workflow est un guide pratique pour concevoir des pipelines MLOps de bout en bout couvrant la préparation des données, l'entraînement, la validation, le déploiement et le monitoring, avec des modèles d'orchestration pour automatiser des workflows reproductibles.

Workflow Automation
Favorites 0GitHub 0