Wevaluation-methodology作者 wshobsonevaluation-methodology 技能說明 Model Evaluation 中的 PluginEval 評分方法,涵蓋評估層級、評分規準、綜合計分、徽章門檻,以及如何解讀結果並改善較弱面向的實務建議。模型評測收藏 0GitHub 32.6k