W
llm-evaluation
by wshobson
Implementieren Sie robuste Evaluationsabläufe für LLM-Anwendungen mit automatisierten Metriken, menschlichem Feedback und Benchmarking. Ideal für Teams, die LLM-Leistung testen, Modelle vergleichen oder KI-Verbesserungen validieren.
Skill Testing
Favorites 0GitHub 0
