model-hierarchy
作者 zscolemodel-hierarchy 技能帮助智能体把任务分派给能够处理它的最低成本模型,在不牺牲常规质量的前提下提升成本控制效果。这个 model-hierarchy 指南适用于 Workflow Automation、子智能体创建和简单任务分类。它适合那些希望采用可重复的 model-hierarchy 使用模式,而不是临时挑选模型的安装场景。
该技能评分为 78/100,说明它是 Agent Skills Finder 中一条相当有价值的候选项:对需要模型路由指导的用户来说值得安装,但仍有一些清晰度上的小缺口需要留意。仓库提供了明确的触发条件、具体的路由规则和示例集成,因此智能体比起面对通用提示词,更容易直接上手。
- 明确给出触发条件和适用场景,涵盖模型路由、成本优化和子智能体创建。
- SKILL.md 中有较充实的工作流内容,并提供了 OpenClaw 以及 Claude Code/Codex 集成示例。
- 包含场景测试和任务分级示例,帮助智能体区分常规、适中和复杂任务。
- SKILL.md 中没有安装命令,因此用户需要自行调整复制/安装步骤。
- 部分占位符或待补充标记,以及被截断的 README,说明文档还不够打磨,也未完全完善。
model-hierarchy 技能概览
model-hierarchy 是做什么的
model-hierarchy 技能帮助 agent 把工作路由到能胜任该任务的最低成本模型。它适合那些希望更好控制成本、又不想在日常任务上牺牲质量的场景。如果你的工作流把高价 token 花在文件读取、状态检查、格式化或简单查询上,这个技能提供的是一套实用的 model-hierarchy 指南,而不是只靠直觉做判断。
适合安装给谁
如果你运行的 agent 工作流会派生子 agent、频繁切换模型,或者要为大量小任务付费,就值得安装 model-hierarchy。它对 Workflow Automation、Claude Code 风格的配置,以及任何“选错模型会悄悄抬高成本”的环境尤其有用。如果你已经在代码里做了严格的路由控制,或者模型切换本来就很少,它的价值就没那么大。
它和别的方案有什么不同
这个技能不只是简单地说“用更便宜的模型”。它编码了一条明确的判断规则:常规任务走低档,中等任务停留在中档,只有真正困难的问题才值得用高级推理模型。正因为如此,model-hierarchy 比泛泛的提示词更可执行,它给 agent 提供了可重复的分类习惯,也给子 agent 工作设定了清晰默认值。
如何使用 model-hierarchy 技能
安装 model-hierarchy
这个仓库的设计方式是把它作为一个 skill 复制到你的 agent 技能目录或 prompt 上下文中。对于 OpenClaw,repo README 展示的是把 SKILL.md 复制到 skills 路径,然后重启 gateway。对于 Claude Code / Codex 风格系统,实际安装方式通常是把路由规则贴进 CLAUDE.md 或项目说明里。如果你在评估 model-hierarchy install,先确认你的 agent 是从文件、全局指令,还是 repo 本地配置里读取 skills。
从正确的输入开始
model-hierarchy usage 最好用在你明确告诉 agent 三件事的时候:任务类型、预期输出,以及这个任务是否属于更大工作流的一部分。弱输入是:“帮我看看这个 repo。” 更强的输入是:“把这个任务分成常规或中等,然后选择最便宜、又能安全读取 config.json 的模型,汇总结果,并说明如果分类错了会有什么风险。” 这样技能才有足够上下文做出正确路由。
先读这些文件
先看 SKILL.md 里的路由规则,再检查 README.md 里的安装模式,以及 examples/claude-code.md 或 examples/openclaw.md 中的平台特定用法。如果你想理解边界行为,tests/scenarios.json 很有用,因为它能直接展示这个技能如何区分常规任务和中等任务。这是理解 model-hierarchy skill 的最快路径,不必把整个仓库逐行读完。
在工作流里使用它
一个实用的 model-hierarchy 工作流是:先分类任务,再判断它属于 routine / moderate / complex,然后在执行前选择最便宜、但仍可接受的模型。对子 agent 来说,默认优先便宜模型,除非任务需要深度推理或视觉能力。如果任务包含图像输入、图表读取或其他非文本工作,就要明确指出,因为这类场景不应使用纯文本模型。这个边界比 token 成本更重要。
model-hierarchy 技能常见问题
model-hierarchy 只适用于 OpenClaw 吗?
不是。OpenClaw 只是其中一种受支持的集成方式,但这个技能同样适用于 Claude Code、Codex,以及其他允许你在指令里定义路由行为的 agent 栈。只要你的系统能遵循模型选择策略,model-hierarchy 通常都能接入。
它和普通提示词有什么区别?
普通提示词通常只要求一次性行为。model-hierarchy 技能提供的是一条可复用的路由规则,agent 可以在每次任务前都应用它。这使它更适合重复操作、后台 agent,以及模型选择本身就是工作一部分、又对成本敏感的流程。
它适合新手吗?
适合,只要你能区分常规、中等和复杂任务。这个技能比完整的 policy engine 简单,但你仍然需要诚实判断任务难度。如果你把困难调试或视觉类工作误判成常规,模型一旦失败、需要重跑,省下来的成本就会被抵消。
什么时候不该用它?
不要把 model-hierarchy 当成对所有任务一刀切降档的策略。如果工作需要深度调试、架构决策、安全审查或多模态输入,最便宜的模型通常不是正确选择。如果你的组织已经在代码里用强约束强制模型选择,它的适配度也会比较差。
如何改进 model-hierarchy 技能
给任务标签更明确
提升 model-hierarchy 效果最快的方法,是一开始就把任务类别说清楚。好的输入会直接写出动作和预期复杂度,比如:“常规文件查找”、“中等难度代码草稿”或“带有前次失败记录的复杂调试”。这样能减少猜测,帮助 agent 第一次就选对档位。
说明会影响路由的约束
只要你提到上下文长度、多模态输入或失败容忍度,模型选择就会改变。比如:“这是一个来自 200 行日志的纯文本总结任务”或“这需要分析截图,所以不要用纯文本模型。” 这些细节很关键,因为它们会暴露技能不该为了省成本而忽略的错配场景。
第一轮后继续迭代
如果第一次输出显得过度设计,可以让 agent 重新分类任务,并解释为什么选这个档位。如果结果感觉太弱,就要求升级,并指出缺失的信号:跨文件推理、歧义,或者前次失败。model-hierarchy guide 最适合当作路由检查,而不是一次性的最终裁决。
注意常见失败模式
最主要的失败模式,是把“看起来很简单”的任务当成常规任务,但它们其实隐藏了依赖关系、边界情况或视觉需求。另一个问题,是把技能直接复制进工作流,却没有告诉 agent 去哪里找这条 policy,也没有说明什么时候可以覆盖它。要改进 model-hierarchy for Workflow Automation,最好把路由规则放在任务源附近,并明确升级路径。
