2026 年初,AI 智能体(AI Agent)领域正在经历一场深层变革。
当 OpenClaw 以病毒式传播速度定义了"自托管个人 AI 助手"品类时,一个来自研究型实验室的项目正在以截然不同的路径崛起——Hermes Agent,由 Nous Research 打造,被称为"第一个真正会自我进化的开源智能体"。

与 OpenClaw 聚焦于广度集成和通道覆盖不同,Hermes Agent 将赌注押在了学习深度上。它不仅执行任务,还能从执行经验中提取可复用的技能(Skills),在运行过程中不断改进自身的能力。
这意味着,你用它越久,它就越强。
核心数据:22K+ GitHub Stars · 142 贡献者 · 40+ 内置工具 · MIT 开源协议
Nous Research:从模型训练者到智能体构建者
理解 Hermes Agent,首先需要理解它的创造者。Nous Research 于 2022 年作为一个松散的在线社区在 Discord 和 Twitter 上形成,2023 年由 Jeff Quesnelle、Karan Malhotra、Teknium 和 Shivani Mitra 等人正式创立。从一开始,他们就以开源优先和去中心化为核心理念,目标是构建用户可控的 AI。

Nous Research 的核心产品线包括 Hermes 系列(高性能微调模型)、Nomos(推理优化模型)和 Psyche(分布式训练框架)。2025 年发布的 Hermes 4 引入了混合推理和大规模合成数据生成能力。而 Hermes Agent 则是所有技术线的自然汇聚——一个由模型训练者亲手打造的智能体框架。
苏米注:这一点很关键。大多数 AI 智能体框架由应用层开发者构建,他们围绕现成的 API 设计工作流。Hermes Agent 由训练模型的同一批研究者构建,这意味着智能体与底层模型之间有深度的参数级协同——它知道正确的温度参数,因为创造它的人也开发了它运行的模型。
核心架构:「执行—学习—改进」的闭环
Hermes Agent 与大多数智能体的根本区别在于架构的核心关注点。传统智能体遵循简单的循环:接收任务→规划→执行→返回结果,会话结束后一切归零。而 Hermes 在执行之后增加了一个关键环节:评估、提取、技能生成与自我改进。
这套闭环学习系统由三个核心组件驱动:
持久记忆系统
Hermes 使用 FTS5 全文检索引擎搜索存储在 SQLite 中的所有历史会话,结合 LLM 驱动的摘要生成。智能体可以回忆数周前的对话内容,搜索自身的交互历史,并在此基础上构建对用户工作方式的深层理解。这是一个三层记忆架构:会话记忆(当前对话)、持久记忆(跨会话的事实与偏好)以及技能记忆(学到的解决模式)。
自主技能生成
当 Hermes Agent 完成一个复杂的多步骤任务后,它能将解决方法抽象为一个可复用的技能文档(Markdown 格式),存储在 ~/.hermes/skills/ 目录中。这些技能采用渐进式披露模式以最小化 token 消耗:Level 0 时智能体只看到技能列表和描述(约 3000 tokens),Level 1 时才加载特定技能的完整内容。每完成约 15 个任务,Hermes 会自动评估自身表现,提取成功经验并写入可复用技能。
苏米注:这是 Hermes 最吸引人的特性。传统智能体的技能是静态的——你编写一个 SKILL.md 文件,智能体使用它,如果出错或不完整,你需要手动修改。Hermes 采用了根本不同的路径:智能体完成任务后自动提取可复用模式,生成技能文档,并在后续使用中持续优化该技能。用户反馈显示,Hermes 在使用自生成技能后,完成类似研究任务的速度可提升约 40%。
辩证式用户建模
通过集成 Honcho 框架,Hermes 构建了一套持续深化的用户画像系统。它不是简单地记录偏好设置,而是通过辩证方式理解你是谁——你的决策模式、工作习惯和认知风格,并据此调整交互方式。
40+ 内置工具与全栈能力
| 能力 | 说明 |
|---|---|
| Web 搜索与浏览 | 内置搜索引擎集成、浏览器自动化和网页视觉分析能力 |
| 终端与代码执行 | 完整 Shell 访问、Python RPC 脚本、代码沙箱隔离执行 |
| 视觉与图像生成 | 图像理解、图像生成和多模态推理能力开箱即用 |
| MCP 协议支持 | 连接任意 MCP 服务器扩展工具能力,兼容开放标准 |
| 子智能体委派 | 生成隔离的子智能体进行并行工作流,零上下文成本 |
| 自然语言定时任务 | 用自然语言设置 cron 定时任务,自动发送报告和监控 |
| 语音管线 | 完整 STT + TTS 管线,支持 CLI、Telegram 和 Discord 语音频道 |
| 研究级 RL 训练 | Atropos 强化学习环境、轨迹批量生成与压缩 |
Programmatic Tool Calling 是一个特别值得关注的能力。通过 execute_code,Hermes 可以将多步骤工具调用流水线压缩为单次推理调用,大幅降低延迟和 token 消耗。
60 秒安装,随处运行
Hermes Agent 在部署便利性上做得极其出色。一行命令即可在 Linux、macOS 或 WSL2 上完成安装,无需任何先决条件。
# 一行命令安装 Hermes Agent
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
# 配置模型供应商
hermes model
# 开始对话
hermes
# 设置消息网关
hermes gateway setup
hermes gateway start
# 安全沙箱模式
hermes config set terminal.backend docker
它支持五种部署后端:本地直接运行、Docker 容器隔离、SSH 远程服务器、Singularity(HPC 环境)以及 Modal/Daytona 无服务器基础设施。你可以在一台 5 美元/月的 VPS 上运行它,闲时成本几乎为零,然后通过 Telegram 从手机端与之对话。
模型兼容性方面,Hermes 支持 Nous Portal(OAuth)、OpenRouter(200+ 模型)、OpenAI、Anthropic 以及任何自托管端点(Ollama、vLLM、SGLang)。切换供应商只需一条命令,无需修改代码。
Hermes Agent vs OpenClaw:两种哲学的对决
2026 年初,如果要选择一个自托管 AI 智能体,Hermes Agent 和 OpenClaw 是两个最值得关注的选项。它们解决同样的问题,但从相反的方向出发。理解它们的差异,本质上是理解两种不同的智能体设计哲学。
OpenClaw 将智能体视为一个需要编排的系统,核心问题是路由与控制。Hermes 将智能体视为一个需要培养的意识,核心问题是记忆与自我改进。
——The New Stack 技术深度对比
架构哲学的根本分歧
OpenClaw 的核心抽象是 Gateway——一个持久运行的 Node.js 进程,充当控制平面,管理路由、权限、通道集成和技能调度。AI 模型是可插拔的组件,Gateway 才是持久的、始终在线的核心。OpenClaw 的设计哲学认为,难题在于"谁能触达你的智能体、在什么条件下、通过什么通道"。
Hermes Agent 的核心抽象是 AIAgent 循环——一个同步编排引擎。Gateway、Cron 调度器、工具运行时、ACP 集成和 SQLite 持久化都围绕这个循环构建。Hermes 的设计哲学认为,难题在于"智能体如何随时间积累知识和能力"。
核心维度对比
| 对比维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 开发者 | Nous Research(研究型实验室) | Peter Steinberger → OpenAI / 社区基金会 |
| 核心架构 | Agent Loop 驱动(自我进化闭环) | Gateway 驱动(控制平面模式) |
| 技术栈 | Python | Node.js / TypeScript |
| 技能系统 | 自主创建 + 自我改进 | 人工编写 + ClawHub 社区共享 |
| 记忆架构 | 三层记忆 + FTS5 + Honcho 用户建模 | 知识图谱 + 每日笔记 + 隐式知识 |
| 通道覆盖 | Telegram / Discord / Slack / WhatsApp / Signal / CLI | 20+ 通道,含 iMessage / WeChat / Teams 等 |
| GitHub Stars | ~22,000(2026 年 4 月) | 250,000+ |
| 模型支持 | 200+ 模型(OpenRouter)+ 自托管 | 主流商用模型 + Ollama 本地模型 |
| 安全设计 | Tirith 预执行扫描 / 容器强化 / 文件系统快照 | 曾曝出 CVE-2026-25253 等安全漏洞 |
| 研究能力 | Atropos RL / 轨迹批量生成 / 压缩 | 不适用 |
| 最佳场景 | 长期个人助理 / 研究工作流 / 自改进需求 | 团队协作 / 多通道运营 / 快速部署 |
安全模型的差异
安全性是另一个关键分歧点。OpenClaw 因快速增长暴露了一些安全问题——Cisco 的 AI 安全团队发现第三方 OpenClaw 技能存在数据外泄和提示注入风险,技能仓库缺乏充分的审查机制。此外,2026 年初还被发现了一个严重的一键远程代码执行漏洞。
Hermes 在安全方面采用了更保守的默认策略:用户授权检查、Tirith 预执行命令扫描器、只读根文件系统、容器能力降权、命名空间隔离以及文件系统自动快照与回滚。虽然较小的用户基数意味着更少的攻击面,但其安全-by-default 的设计理念值得肯定。
踩坑记录:如果你计划在生产环境部署智能体,建议优先考虑 Hermes 的安全默认配置。OpenClaw 的社区生态虽然丰富,但第三方技能的安全性需要自行审查。
生态系统与社区发展
2025 年中期,Hermes Agent 推出了 Skills Hub(agentskills.io),社区贡献的技能可以在不同的 Hermes Agent 安装之间移植和共享,遵循开放标准。到 2025-2026 年期间,持续的自我改进循环功能逐步完善,包括智能体策展记忆、Honcho 用户建模、MCP 集成以及 Daytona/Modal 无服务器部署支持。
相比之下,OpenClaw 拥有压倒性的社区规模优势——超过 5700 个社区技能和 100 多个预配置的 AgentSkills 包。但 Hermes 的独特优势在于它与 Nous Research 模型生态的深度整合,以及面向 ML 研究者的 RL 训练管线。
苏米注:一个值得关注的区别是,Hermes 社区中有开发者构建了 PLUR 插件,实现了基于 ChromaDB 的"engram 式"情景记忆系统,支持跨 6 个智能体共享情景记忆。这种开放架构带来的可扩展性,是托管型云服务难以复制的。
选谁?取决于你的核心需求
🟢 选 Hermes Agent,如果你……
- 需要一个长期运行、持续积累经验的个人 AI 助手
- 正在进行 AI 研究工作,需要 RL 训练和轨迹生成能力
- 偏好安全-by-default 的设计和更强的隔离保障
- 希望智能体随时间推移真正变得"更懂你"
🟡 选 OpenClaw,如果你……
- 需要覆盖 20+ 消息通道的广泛集成能力
- 有团队协作场景需要多智能体路由和权限隔离
- 追求最大化的社区生态和开箱即用的技能覆盖
- 偏好 Node.js/TypeScript 技术栈和 Gateway 架构模式
结语:智能体进化的两条路径
在 AI 智能体领域,我们正在见证一个熟悉的技术演进模式:先驱者定义品类,后来者探索不同的权衡与方向。OpenClaw 让自托管 AI 智能体的概念变得触手可及,而 Hermes Agent 则提出了一个更深层的问题——如果一个智能体不仅能执行任务,还能从经验中真正学习和成长,会怎样?
Hermes Agent 的 22,000 颗星或许远不及 OpenClaw 的 25 万,但让它值得关注的并非当前规模,而是底层架构所蕴含的可能性。当一个由模型训练者构建的智能体框架,将"自我改进"作为一等公民而非事后补丁时,它所代表的不仅是一个工具选择,更是一种对 AI 智能体未来形态的独特赌注。
最佳实践:两条路径都有各自的价值。但如果你相信 AI 智能体的终极价值在于随时间复利般增长的能力积累,那么 Hermes Agent 是 2026 年最值得深入研究的开源项目之一。