Aagent-eval作者 affaan-magent-eval 是一款用來讓程式代理在可重現任務上進行正面比較的 skill,可比對通過率、成本、耗時與一致性。若你想在自己的 repo 中評估 Claude Code、Aider、Codex 或其他代理,agent-eval skill 能提供比臨時下提示更清楚、更有依據的評估結果。模型評測收藏 0GitHub 156k