跳转到主要内容
HermesAgent.Work
模型接入

Hermes Agent 接入 OpenRouter:模型选择与成本思路

讲清 Hermes Agent 接入 OpenRouter 后如何按任务选择模型、平衡成本与效果,并记录失败重试和人工修改成本。

更新 2026-06-0110 分钟阅读模型接入OpenRouter模型成本API

最后更新 2026-06-01 · HermesAgent.Work 编辑组 整理维护(内容维护说明)· 步骤过时或无法复现可反馈

为什么很多人先用 OpenRouter

OpenRouter 的优势是模型选择多、切换方便,适合测试不同任务的成本和效果。你可以用便宜模型做摘要、分类、格式化,用更强模型处理复杂判断和关键生成。

先跑通,再优化

第一轮不要急着调 provider routing、fallback、排序和复杂模型策略。先让一个模型稳定完成短问答,再跑 Starter 包里的一个只读模板。链路稳定后,再考虑把任务拆成高频低成本和低频高质量两类。

hermes model
hermes config check
hermes doctor

任务分层

  • 信息摘要:优先低成本模型。
  • 分类打标:看一致性,不只看价格。
  • 复杂分析:选择推理能力更好的模型。
  • 对外回复:需要更严格的质量控制和人工确认。
低风险任务先自动化,高风险任务先出草稿,再人工确认。

模型选择的实用判断

日报、RSS 摘要、标签建议这类任务,重点是稳定和便宜;PR 风险判断、客户回复、研究综述这类任务,重点是理解能力和可控输出。不要把所有任务都打到同一个模型,也不要为了省一点单价牺牲大量人工修改时间。

成本记录

建议每个工作流都记录触发次数、平均输入长度、平均输出长度和失败率。跑 1-2 周后再决定是否升级模型,而不是凭感觉调参。

date,workflow,model,input_size,status,retry_count,human_edit_minutes
2026-05-31,daily-brief,openrouter/model,medium,success,0,3

常见错误怎么排

401 先查 Key 和当前 shell;429 先降频和缩短输入;model not found 先确认模型名;CLI 能用但 Gateway 不能用,优先重启 Gateway。一次只改一个变量,才能判断到底是哪一步恢复。

注意事项

不要把 API Key 写进前端代码。所有敏感 Key 都应只存在于服务端环境变量中。截图、录屏、日志和网盘资源包里也不要出现真实 Key。

还没有真实场景?可以先领取 [Free Starter 模板包](/free-template-pack),从低风险只读任务开始试跑。

常见问题

把搜索里最常见的疑问集中放在这里,适合排查时快速确认方向。

OpenRouter 第一轮应该选便宜模型还是强模型?+
第一轮先选一个稳定模型跑通链路,再按任务分层。高频摘要可用低成本模型,复杂判断和对外回复再切更强模型。
Hermes Agent 接入 OpenRouter 后最常见错误是什么?+
最常见的是 API Key 没加载、模型名不完整、会话没有重启、额度不足或 429 限流。先用短问答复现,不要直接跑长工作流。
成本应该怎么记录?+
至少记录工作流名称、模型、输入规模、输出规模、是否成功、重试次数和人工修改时间。只看单次价格会低估真实成本。