W
llm-evaluation
by wshobson
Mettez en place des workflows d'évaluation robustes pour les applications LLM grâce à des métriques automatisées, des retours humains et des benchmarks. Parfait pour les équipes testant les performances des LLM, comparant des modèles ou validant des améliorations IA.
Skill Testing
Favorites 0GitHub 0
