Plugin Eval

Plugin Eval taxonomy generated by the site skill importer.

1 个技能
W
evaluation-methodology

作者 wshobson

evaluation-methodology 技能说明了用于 Model Evaluation 的 PluginEval 评分方法,包括评估层级、评分 rubric、综合评分、徽章阈值,以及如何解读结果并改进薄弱维度的实用建议。

模型评测
收藏 0GitHub 32.6k