Plugin Eval

Plugin Eval taxonomy generated by the site skill importer.

1 skills
W
evaluation-methodology

by wshobson

evaluation-methodologyは、Model EvaluationにおけるPluginEvalの採点方法を解説するスキルです。評価レイヤー、ルーブリック、合成スコア、バッジ閾値に加え、結果の読み解き方や弱い評価軸の改善に役立つ実践的な指針を確認できます。

Model Evaluation
Favorites 0GitHub 32.6k