Model Evaluation

Model Evaluation taxonomy generated by the site skill importer.

1 skills
W
llm-evaluation

by wshobson

Mettez en place des workflows d'évaluation robustes pour les applications LLM grâce à des métriques automatisées, des retours humains et des benchmarks. Parfait pour les équipes testant les performances des LLM, comparant des modèles ou validant des améliorations IA.

Skill Testing
Favorites 0GitHub 0