HermesAgent.Work
Models

Hermes Agent 模型接入指南

模型不是越贵越好。先选一个能稳定跑通的默认模型,再按任务风险、成本和上下文长度做路由。

01 / Provider

先按场景选入口

第一次接入只选一个 Provider。等 CLI、Memory、Skills 都稳定后,再考虑路由和多模型策略。

OpenRouter

适合:先跑通、想快速切换模型、需要成本和速度路由

配置:准备 API Key,使用 `hermes model` 选择 Provider,再跑一次短对话。

检查:注意模型名称、上下文窗口、单次请求价格和限速。

Nous Portal

适合:想用 Nous 侧模型入口,且希望少维护第三方路由规则

配置:完成账号和 Key 后,通过模型配置向导绑定。

检查:确认额度、区域可用性和你要用的模型是否开放。

Ollama

适合:隐私优先、本地实验、低成本文本任务

配置:先让本地模型服务稳定运行,再让 Hermes 指向本地端点。

检查:本地显存、响应速度和上下文长度会直接影响体验。

OpenAI 兼容端点

适合:自托管网关、企业代理、内部模型平台

配置:准备 base URL、model name 和 Key,先用最小请求测试。

检查:检查 streaming、tool calling、超时和错误格式是否兼容。

配置和重配命令

`hermes model` 用来处理模型配置。切换 Provider 后,先退出当前会话,再重新打开 Hermes 验证。

hermes model
hermes model list
hermes model set <provider/model> --provider <provider>
hermes setup model --reconfigure
hermes config check
hermes doctor
hermes

OpenRouter 路由思路

高频低风险任务优先控制成本;代码、研究、长文档再切换更强模型。路由配置先小范围测试,避免把所有任务都打到贵模型。

provider_routing:
  sort: price
  allow_fallbacks: true
  only:
    - <preferred-provider>
  ignore:
    - <unstable-provider>
02 / 任务匹配

不同任务用不同模型

日报、摘要、分类
低成本模型
看稳定性和批量价格
代码审查、需求拆解
强推理模型
看上下文和工具调用能力
客服草稿、销售跟进
稳定通用模型
看语气稳定性和延迟
研究、论文、长文档
长上下文模型
看 64K 以上上下文和引用整理能力
本地隐私任务
Ollama / 自托管
看本机资源和响应速度
03 / 验收

模型接入完成的标准

不要只看“能不能回复”。真正可用的模型配置,要能解释错误、控制成本、承受重复调用,并知道什么时候需要人工确认。

下一步接 Gateway
能完成 1 次 20 秒内的短对话。
能处理 64K 上下文需求,或知道当前模型的上下文上限。
能在失败时看到明确错误:401、429、timeout、model not found。
有一个低成本默认模型,也有一个高质量备用模型。
Gateway 或工作流不会无限重试同一个模型错误。
高频任务已经设置输入长度、触发频率和人工确认边界。