Wevaluation-methodology作者 wshobsonevaluation-methodology 技能说明了用于 Model Evaluation 的 PluginEval 评分方法,包括评估层级、评分 rubric、综合评分、徽章阈值,以及如何解读结果并改进薄弱维度的实用建议。模型评测收藏 0GitHub 32.6k