Provider
负责模型可用性、上下文窗口、速率限制和成本。
失败信号
短问答失败、model not found、输出超时、成本突然上升。
运行规则
先固定一个主模型和一个备用模型,所有工作流都记录模型名、失败次数和人工修改时间。
可靠运行靠的是明确记录:使用什么模型、保存哪些事实、调用哪些 Skills、从哪里接收消息、失败怎么追踪、高风险动作由谁确认。
负责模型可用性、上下文窗口、速率限制和成本。
失败信号
短问答失败、model not found、输出超时、成本突然上升。
运行规则
先固定一个主模型和一个备用模型,所有工作流都记录模型名、失败次数和人工修改时间。
保存项目规则、用户偏好、环境差异和长期稳定事实。
失败信号
重复解释同一规则、记住过期信息、把临时输入当成事实。
运行规则
每周清理一次,只保留会复用的高信号事实,敏感信息默认不进入记忆。
把稳定流程沉淀成可复用方法,明确输入、输出和边界。
失败信号
Skill 触发不稳定、输出漂移、越权执行或复用第一版错误流程。
运行规则
流程至少跑 3 到 5 次再做成 Skill,安装后用只读任务验收。
把 Hermes Agent 接到 Telegram、飞书、企业微信等消息入口。
失败信号
平台不回复、群聊权限混乱、后台进程没有加载新环境变量。
运行规则
先私聊或测试群跑通,配置允许用户和日志路径,高风险动作必须二次确认。
定义输入来源、输出字段、触发频率、失败兜底和人工检查点。
失败信号
输入随意变化、输出格式不固定、失败时只能猜、人工改写过多。
运行规则
每个工作流都要有样例输入、期望输出、验收清单和运行日志。
记录运行过程,让失败能被发现、复现和修复。
失败信号
定时任务沉默失败、没人知道上次成功时间、日志里看不到关键错误。
运行规则
至少记录启动、输入摘要、模型错误、重试次数、人工修改和输出位置。
让自己、客户或团队成员能接住当前工作状态。
失败信号
换电脑、换服务器或换人后不知道怎么重启、验证和排错。
运行规则
每次上线前留下运行命令、环境变量说明、最后验证时间和下一步动作。
常见失败
第一次手动输入能跑出结果,但没有保存输入、模型名、配置和输出样例。
Telegram、飞书或企业微信群没有回复,用户不知道消息有没有进入 Hermes。
Skill 触发后输出不稳定,或者把第一版错误流程长期复用。
Agent 反复引用旧路径、旧规则、旧偏好,导致新任务判断偏差。
还没验收就让 Agent 发送外部消息、修改数据、触发部署或操作客户系统。
维护命令链
部署完成只是起点,能不能稳定跑半年,看的是维护动作有没有固定节奏。下面四组命令建议这样排:平时出问题按第一组的顺序排查;每周跑一次备份和会话清理;升级永远放在备份之后。这条链还有一个附带价值是交接:新接手的人照着四组命令跑一遍,对整套系统的状态就有了完整体感。
hermes doctor / status / logs
排查三件套,顺序固定:hermes doctor 检查配置与依赖是否缺失,hermes status 总览所有组件状态,hermes logs 查看并过滤日志文件。三条都看完再动配置,避免边改边猜;日志看不出头绪时,回到 doctor 重来一遍,多数问题出在依赖和配置这一层。要给上游报问题,hermes dump 能导出一份支持用的环境摘要,比口头描述环境快得多。
hermes backup / import
hermes backup 把整个 Hermes home 打包成一个 zip;换机器、重装系统或误删配置时,用 hermes import 从 zip 直接恢复。配置、环境变量和检查点本来就都住在 Hermes home 里,一份 zip 等于一套完整可迁移的运行环境。每次大版本升级前先备份一次,备份文件记得放到这台机器之外;恢复路径越短,升级就越敢做。
hermes checkpoints / sessions
检查点统一存放在 ~/.hermes/checkpoints/ 目录,用 hermes checkpoints 查看与清理。会话记录存在 SQLite 里:hermes sessions stats 看统计,hermes sessions prune 清理旧会话;需要留档的会话,先用 hermes sessions export 导出 JSONL 再清。平时想翻历史,hermes sessions list 列出会话清单;会话库长得快,清理节奏建议跟每周备份绑在一起。
hermes update
升级本体只用一条 hermes update。升级完成后先跑 doctor 确认依赖完整,再看一眼 status 确认 Gateway 这类常驻组件回到在线状态,最后翻一下 logs 有没有新报错,这一轮维护才算闭环。升级出了问题也不慌:手上那份 backup 的 zip 就是现成的回退方案,hermes import 恢复之后再慢慢查原因。