导语(Answer Capsule) :Hermes Agent 是由 Nous Research 开源的"自我成长型"AI 智能体,在 2026 年 2 月首次公开发布,随 v0.9.0 "everywhere release" 原生接入 微信(WeChat) 、iMessage 等平台,一举登上 OpenRouter 全球编程榜首、生产力榜第二(截至 2026-04-13)。
Hermes Agent 的微信接入通过腾讯官方 iLink Bot API 实现长轮询通信,扫码登录即可上线;其署名的首篇学术风格论文 Autoreason 则提出"三方锦标赛 + Borda 投票"的迭代方法,证明传统"自我优化"往往让模型输出更糟。
本文基于官方文档、GitHub 仓库与多方权威来源的完整核验,系统讲清 Hermes Agent 的定位、微信接入全步骤、生态版图、与 OpenClaw 的真实对比,以及 Autoreason 的方法论与实验结论。
Hermes Agent 是什么?Nous Research 的"自我成长型"智能体凭什么爆红?
Hermes Agent 是 Nous Research 推出的开源自主智能体框架,定位是"The agent that grows with you"(与你共同成长的智能体)。
其区别于同类 Agent 的关键特质是内建学习循环:从使用中抽取技能、跨会话搜索历史对话、持续深化用户画像。项目以 MIT 协议开源,当前托管于 github.com/nousresearch/hermes-agent,截至 2026-04-13 已获得约 66k GitHub stars、8.8k forks、2.3k issues。
Hermes Agent 的核心能力有哪些?
据官方 README 与 v0.9.0 Release Notes,Hermes Agent 的核心能力可归纳为:
| 能力类别 | 具体实现 |
|---|---|
| 学习循环 | 从经验中自动生成 skills;skills 在使用中自我改进;自主"持久化"知识 |
| 记忆系统 | 跨会话全文检索历史对话,对用户建模 |
| 多平台接入 | v0.9.0 起覆盖 16 个 messaging 平台 |
| 多模型路由 | 支持 Nous Portal / OpenRouter 200+ / NVIDIA NIM / 小米 MiMo / z.ai GLM / Kimi / MiniMax / OpenAI / 自建端点等 |
| Fast Mode | v0.9.0 起对 OpenAI 与 Anthropic 接入 Fast Mode |
| Dashboard | v0.9.0 起提供本地 web dashboard 与后台进程监控 |
Hermes Agent 为什么一夜爆火?
其爆红的直接触发点是 v0.9.0 "everywhere release" 中原生接入微信这一动作。据 36Kr 英文版报道,截至 2026-04-13:
-
- Hermes 在 OpenRouter token 消耗日榜位列第二,仅次于 OpenClaw
-
- 登上 OpenRouter 全球**"编程应用"榜榜首**
-
- "生产力榜"位列第二
-
- Nous Research 官方账号发中文推文,浏览量达 549.1K,为该实验室近期最高互动之一
Y Combinator 总裁 Garry Tan 在多场合推荐 Hermes Agent,并基于 Hermes + OpenClaw 自建了名为 gbrain 的生产级智能体大脑(含 17,888 页笔记、4,383 人、723 家公司、21 个自动 cron 任务)。
Hermes Agent 的项目时间线是怎样的?
关于"九个月打磨"的表述,项目公开时间线可核对如下:
- • 2026 年 2 月:Hermes Agent 在 MIT 协议下首次公开发布
- • 公开 8 周内:GitHub stars 突破 24.6k
- • v0.9.0 "everywhere release" :新增 WeChat / iMessage 原生支持,平台总数达 16 个,首次 Fast Mode for OpenAI & Anthropic,首推 local web dashboard 与后台进程监控
- • 截至 2026-04-13:GitHub stars 约 66k、forks 8.8k、issues 2.3k
Hermes Agent 如何原生接入微信?四步打通 iLink Bot API 的完整教程
Hermes Agent 的微信接入通过腾讯官方 iLink Bot API 完成,整套流程不依赖 webhook,不需要公网服务器,扫码登录即可上线。其核心机制是长轮询(long-polling)+ 本地 context token 存储。以下为官方文档与实测结合的完整配置流程。
接入微信前需要准备什么?
| 准备项 | 说明 |
|---|---|
| Python 环境 | Python 3.10+(Hermes Agent 官方支持的最低版本) |
| 微信账号 | 建议用小号先试,确认稳定后再挂主号 |
| 依赖包 | aiohttp、cryptography 必装;如需终端二维码额外装 qrcode |
| 存储位置 | 账户凭证默认落盘到 ~/.hermes/weixin/accounts/ |
第 1 步:安装依赖
两个包是硬要求,缺一不可:
pip install aiohttp cryptography
需要在终端里直接看到二维码的话,再加一个:
pip install qrcode
cryptography 库在这一步至关重要——微信的 CDN 走 AES-128-ECB 加密,如果缺这个库,连图片都拉不下来。
第 2 步:运行 setup 向导完成扫码登录
一行命令拉起 setup 向导:
hermes gateway setup
选择 Weixin 平台,接下来整个流程由向导自动完成:
-
- 拉起二维码并在终端绘制(或提供一个链接)
-
- 等待手机扫码
-
- 等待手机端点"确认"
-
- 将账号凭证自动写入
~/.hermes/weixin/accounts/<account_id>.json
- 将账号凭证自动写入
确认成功后,终端会打印:
微信连接成功,account_id=your-account-id
account_id、token、base_url 三样均由向导自动落盘,后续启动不再需要手动填。
第 3 步:写入环境变量(按策略选择)
打开 ~/.hermes/.env,最少把 account_id 塞进去:
WEIXIN_ACCOUNT_ID=your-account-id
下表汇总可选环境变量与典型场景:
| 环境变量 | 用途 | 是否必填 |
|---|---|---|
WEIXIN_ACCOUNT_ID | 绑定账号 ID | 必填 |
WEIXIN_DM_POLICY=allowlist | 限定私聊来源 | 可选 |
WEIXIN_ALLOWED_USERS=user_id_1,user_id_2 | 私聊白名单 | 与 DM_POLICY 搭配使用 |
WEIXIN_GROUP_POLICY=allowlist | 限定群聊来源 | 可选 |
WEIXIN_GROUP_ALLOWED_USERS=group_id_1 | 群聊白名单 | 与 GROUP_POLICY 搭配使用 |
WEIXIN_HOME_CHANNEL=chat_id | 定时任务与通知发送目标 | 可选 |
WEIXIN_HOME_CHANNEL_NAME=Home | 对应通道展示名 | 可选 |
群消息默认处于关闭状态,想让 Bot 在某群响应必须显式开 allowlist。
第 4 步:启动 Gateway 服务
一行命令起服务:
hermes gateway
适配器会自动捡回前面落盘的凭证,连上 iLink,开始长轮询。在手机微信里给 Bot 发送任意消息,数秒内即可看到回信,对话框里会同步显示"正在输入"状态。
接入微信有哪些坑?4000 token 截断、session 过期等常见故障排查
Hermes Agent 微信适配器当前最大的体验短板,是微信单条消息 4000 token 上限导致的 chunking 截断。其它高频故障集中在 session 过期、token 并发冲突、媒体文件解密失败三类。以下提供一个已被社区踩过的完整故障清单。
微信接入的常见故障与解决方案
| 故障现象 | 根因 | 解决方案 |
|---|---|---|
| 长回复被切成多段甚至被截断 | 微信单条消息上限 4000 token,Hermes 自动 chunking | 暂无更优解;长文案建议改用群公告、文件推送或企业微信适配 |
| 掉线 / 错误码 -14 | iLink session 过期 | 重新运行 hermes gateway setup 扫新码 |
| "Another local Hermes gateway is already using this Weixin token" | 同一 token 被多个 gateway 占用,一个 token 只能挂一个 poller | 停掉其它 gateway 实例;或使用社区桥接项目 HermesClaw |
| 媒体文件收发失败 | cryptography 未安装,无法解密 AES-128-ECB CDN | 确认 pip install cryptography 已完成 |
| 格式渲染不美观 | 微信个人聊天不支持完整 Markdown | 适配器会自动转换(header → 【标题】或 标题;table → 键值对列表;代码块原样保留) |
怎么在同一个微信账号上同时跑 Hermes 与 OpenClaw?
原文没提的现实问题是:Hermes Agent 与 OpenClaw 都原生支持微信,但不能在同一账号同时挂载——两个 gateway 会互相抢占 iLink 连接,其中一个会收到 403 错误并丢消息。
社区项目 HermesClaw(约 500 行 Python 代理,由 AaronWong1999 维护)为此提供了桥接:它成为唯一的 iLink poller,随后在本地运行两个代理服务,分别对应 Hermes 与 OpenClaw,让两者都以为在和真正的 iLink API 通信。HermesClaw 不处理媒体、不调用 Agent API、不触碰 Agent 记忆,只负责原始 iLink 协议消息的队列转发。
灵芽API 一个账号对接所有模型 稳定可靠 官方资源 https://api.lingyaai.cn/
Hermes 已覆盖哪些 messaging 平台?v0.9.0 "everywhere release" 里的 16 个渠道
Hermes Agent v0.9.0 "everywhere release" 之后,支持的 messaging 平台数量已达 16 个,覆盖海外主流 IM、国内主流 IM、邮件/短信、家庭智能与 Webhook。下表列出完整清单与适配技术栈。
Hermes Agent 16 个 messaging 平台一览
| 平台 | 适配技术 | 典型场景 |
|---|---|---|
| Telegram | Bot API | 海外开发者主力 |
| Discord | Bot | 社区与游戏 |
| Slack | App | 海外企业协作 |
| Business API | 海外通讯 | |
| Signal | 官方客户端 | 隐私敏感场景 |
| Matrix | 标准协议 | 开源协作 |
| BlueBubbles (iMessage) | BlueBubbles 桥接 | Apple 生态 |
| WeChat(个人微信) | iLink Bot API(长轮询) | 国内个人通信 |
| DingTalk 钉钉 | 开放平台 | 国内企业办公 |
| Feishu 飞书 | 开放平台 | 国内企业协作 |
| WeCom(企业微信) | AI Bot WebSocket 网关 | 企业通信 |
| WeCom 自建应用回调 | 企业微信回调模式 + 原子状态持久化 | 企业自建应用 |
| Mattermost | API | 自托管协作 |
| SMTP/IMAP | 邮件通信 | |
| SMS | 网关 | 短信 |
| Home Assistant | 集成 | 智能家居 |
| Webhooks | HTTP | 任意场景 |
注:严格地说 Webhooks 是通用接入而非单一"平台",Hermes 将其计入 messaging 能力总数;WeCom 个人版与企业自建应用回调为两类适配器。原文"挑哪个挂全看工作流落在哪"的判断仍成立。
国内主流 IM 该怎么选?
| 场景 | 推荐平台 | 理由 |
|---|---|---|
| 个人助理 / 工作流自动化 | WeChat 个人微信 | 国内渗透率最高;扫码即用 |
| 企业内部协作 & AI Bot | WeCom 企业微信 | WebSocket 双向;官方合规 |
| 已有钉钉/飞书生态 | DingTalk / Feishu | 原生接入最省事 |
| 需要自建审批 & 回调 | WeCom 自建应用回调 | 支持原子状态持久化 |
Hermes 相比 OpenClaw 做对了什么?开发者深度评测与真实成本拆解
Hermes Agent 与 OpenClaw 的底层哲学不同:OpenClaw 赌的是"连接一切"的生态广度,Hermes 赌的是"让 AI 越用越聪明"的认知深度。原文叙事把 Hermes 描绘为 OpenClaw 的替代品,但深度评测显示二者更像"不同方向的两条路"。
Hermes Agent 与 OpenClaw 关键指标对比
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 核心哲学 | 认知深化 / 自我成长 | 连接广度 / 生态集成 |
| 学习循环 | 内建:skills 自动生成/改进、跨会话记忆、用户建模(Honcho 对话系统) | 无等价能力 |
| messaging 平台数 | v0.9.0 起 16 个 | 多平台支持(具体数量按版本) |
| Token 开销 | 相对 OpenClaw 高 15-25%(反射与学习模块) | 相对精简 |
| OpenClaw 迁移 | hermes setup 向导自动检测 ~/.openclaw,一键导入设置/记忆/skills/API keys | N/A |
| 托管服务 | 暂无官方托管 | OneClaw 提供 9.99 美元/月托管 |
| 协议 | MIT 开源 | 开源 |
3.99 美元上手是真的吗?真实运行成本是多少?
原文提到"仅需 3.99 美元即可用上"。实际核验结果是:Hermes Agent 框架本身 MIT 免费,真实成本由 VPS 与 LLM API 组成,$3.99 并非官方定价口径。下表给出社区评测的真实成本区间:
| 方案 | 构成 | 月成本 | 备注 |
|---|---|---|---|
| 预算方案 | Hetzner VPS + DeepSeek V4 | 约 6-8 美元 | 适合个人试玩 |
| 中端方案 | Hostinger + Claude Haiku | 约 15-25 美元 | 日常可用 |
| 高端方案 | DigitalOcean + Claude Sonnet 4.6 | 约 40-80 美元 | 生产级工作流 |
| 托管竞品 | OpenClaw Launch Lite 首月促销 | 约 3 美元(后续 6 美元/月) | 含 AI 额度,非 Hermes 官方 |
因此,原文"3.99 美元上手"更接近托管竞品或促销价格,而非 Hermes 官方定价;成稿中保守处理。
独立评测给出的复杂任务单次成本
独立测评显示,在使用预算型模型(GPT-5.4 Mini / Claude Haiku 4.5 / Hermes 4 70B)运行复杂 Agent 任务时,每任务平均成本约 0.30 美元。其中固定开销约占 73%,tool definitions 本身就吃掉 50%,这是所有 Agent 框架的通病,并非 Hermes 独有。
Autoreason 论文讲了什么?为什么"自我优化"反而会让模型输出变糟?
由 Hermes Agent 参与署名的 Autoreason 论文(原名 "Self-Refinement That Knows When to Stop",作者 SHL0MS 与 Hermes Agent,2026)提出了一个反直觉结论:传统的"让模型自我批评 → 自我修改"循环,无论提示词写得多好,通常都会让结果变得更糟。论文托管于 github.com/NousResearch/autoreason,并由 Autoreason 自身对文章做了最后一轮润色。
传统 Self-Refinement 为什么会失败?
作者总结了传统迭代自我优化的三类结构性缺陷:
| 缺陷名 | 具体表现 | 根源 |
|---|---|---|
| 幻觉瑕疵(Prompt Bias) | 为满足"请批评"指令,模型会凭空捏造不存在的缺点 | 对齐目标被批评提示词拉偏 |
| 规模失控(Scope Creep) | 每一轮迭代内容范围都不受控扩张 | 缺乏"长度/范围"的显式约束信号 |
| 拒绝无能(No Restraint) | 即使原稿已足够好,模型也几乎从不拒绝修改建议 | 模型默认服从指令,"Do nothing" 不是一等公民 |
该结论直接挑战了开发者的常见直觉:"让它再改一版,效果肯定会更好"——论文的实证结果表明这种直觉在多数任务上并不成立。
这与经典 Self-Refine 工作有什么关系?
Self-Refine(NeurIPS 2023,Madaan 等)是此前最被广泛引用的迭代自我反馈方法,Autoreason 的定位是对其在"收敛机制"与"停止信号"维度上的修正。Autoreason 并非推翻该思想,而是指出:缺乏对"不修改"的赋权,会让迭代成为单向增长的破坏过程。
三方锦标赛 + Borda 投票如何让小模型打赢大模型?Autoreason 的实验结果
Autoreason 的核心机制是把每一轮迭代设计成一场"三方锦标赛" :把"维持现状(A)""对抗修改(B)""优势合成(AB)"三个版本交给一组互不共享上下文的"盲评智能体"投票,用 Borda 计数决定赢家,并在"维持现状连胜两次"时自动收敛停止。
三方锦标赛机制如何运转?
| 角色 | 身份 | 动作 |
|---|---|---|
| Incumbent A | 当前原稿 | 维持现状 |
| Critic | 独立批评者(fresh agent) | 对 A 生成 critique |
| Author B | 独立作者(fresh agent) | 基于 critique 写出对抗修改版 B |
| Synthesizer AB | 独立合成者(fresh agent) | 合并 A + B 的优势产出 AB |
| Judge Panel | 3 个盲评智能体 | 用 Borda 计数投票决定胜者 |
| Stopping Rule | "A 连胜两次"收敛 | k = 2 次触发停止 |
关键设计在于: "Do nothing" 是一等公民,不修改被显式建模为一个可以胜出的选项。这与传统 self-refinement 中"必须改一改"的隐性偏见形成对照。
Autoreason 的实验结果有多强?
以下是公开仓库披露的实验结果与规模:
| 指标 | 数值 / 结果 | 说明 |
|---|---|---|
| 写作任务数 | 5 个开放任务 + 3 个受限任务 | 涵盖策略/系统设计/政策/竞争定位/事故响应 |
| 多 seed 复现 | 每任务 15 次独立写作 | 保证统计显著 |
| 编程评测规模 | 150 CodeContests 问题 × 3 策略 × 4 模型梯度 | Sonnet 4 / Sonnet 4.6 / Haiku 3.5 / Haiku 4.5 |
| 模型缩放(private-test) | Haiku 3.5 40% → Haiku 4.5 60% → Sonnet 4 64% → Sonnet 4.6 77% | 仓库披露的口径 |
| 原文引用的失败恢复率 | 据原文转述:62% vs 单次生成 43% | 原文数据,与公开仓库的 private-test 40%-77% 口径不同,可能为论文 PDF 中的另一子实验,建议读者参考 PDF |
| 小模型逆袭 | Haiku 3.5 + Autoreason 的 Borda 得分在 3 项任务达到满分 | 所有 baseline 退化至 single-pass 之下 |
| 内容退化警示 | 15 轮传统 self-refinement 后,345 字精华被删至 102 字(-70%) | Autoreason 的裁判机制拦截"越改越烂"情况 |
| 消融实验 | 判官数量 1/3/7、Borda vs majority、Component 必要性、长度控制评测 | 统计检验含 bootstrap CI + McNemar test |
小模型 + 结构 > 大模型 + 蛮力?
最具启发性的发现是:Haiku 3.5(成本仅 Sonnet 的 1/10)搭配 Autoreason,产出质量可与 Sonnet 4 的单次生成持平。这意味着 AI 推理的性价比前沿正从"大力出奇迹"向"结构出效率"转移。
不过论文也指出了方法的边界:当 private-test 基准准确率达到 60% 时,Autoreason 的增益消失——"生成-评测"之间的鸿沟被基础模型自身填平,迭代优化不再带来增益。这揭示了一个现实的"方法天花板"。
普通开发者如何上手 Hermes Agent?
对于想立即试用的开发者,建议按"选模型 → 选托管 → 选 messaging 平台"的顺序做三个决策,以便在不到半小时内完成首次跑通。
起步前的三个决策
| 决策 | 选项 | 建议 |
|---|---|---|
| 选模型 | Nous Portal、OpenRouter 200+、Anthropic、OpenAI、自建端点 | 预算优先选 Nous Portal 免费档或 DeepSeek V4;质量优先选 Claude Sonnet 4.6 |
| 选托管 | 本地 / Hetzner / Hostinger / DigitalOcean | 试玩选 Hetzner(≈6 美元/月);生产选 DigitalOcean + Sonnet(40-80 美元/月) |
| 选 messaging 平台 | 16 个可选(见前文表格) | 国内个人用户首选 WeChat;企业首选 WeCom;开发者测试首选 Telegram |
常用 CLI 速查
| 命令 | 作用 |
|---|---|
hermes setup | 初始化;自动检测 ~/.openclaw 并提示迁移 |
hermes gateway setup | 启动 messaging 平台配置向导(微信扫码亦在此步) |
hermes gateway | 启动 gateway 服务、开始长轮询 |
hermes model | 切换模型 provider(Nous Portal / OpenRouter / 自建) |
结语:从"连接广度"到"认知深度"的 Agent 赛道分岔
Hermes Agent 的爆火不仅是一次产品胜利,也是一次 Agent 赛道的方向分岔——从"把 AI 接到一切平台上"的连接逻辑,走向"让 AI 随时间自我进化"的认知逻辑。
v0.9.0 "everywhere release" 把这两条路线压在了同一产品里:一方面 16 个 messaging 平台把连接广度推到极致,另一方面 skills 自成长、跨会话记忆把认知深度做成默认能力。
对国内开发者而言,原生微信接入把"需要公网 + webhook"这一以往的最大门槛抹掉,扫码即可跑通。
这让 Hermes Agent 成为当前硅谷 Agent 生态里对国内最友好的开源产品之一。Autoreason 论文则补上了"方法论信号":Nous Research 不仅做产品,也在给 Agent 的推理范式提出新主张。
但需要保留的清醒是:微信单条 4000 token 的截断仍待解决、$3.99 不是官方价、"顶会级"是宣传定性、62% vs 43% 的恢复率与公开仓库 40%-77% 的 private-test 口径并非同一实验。工具可以一夜爆火,但判断一款 Agent 是否值得押注,需要的还是持续的生产验证。
本文核心词汇:
Hermes Agent,Hermes Agent 微信接入,iLink Bot API,Nous Research,Autoreason 论文,Claude,OpenClaw 对比,Hermes Agent 教程,v0.9.0 everywhere release,AI Agent 评测,Self-Refinement,三方锦标赛,Hermes Agent 价格,自我成长智能体
