10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI智能体

Hermes Agent 深度解析:三层记忆 + 自进化 Skill,用得越久越聪明的 AI Agent 框架

1小时前 AI智能体 13 0

两个月,90,000 GitHub Stars。Hermes Agent 凭什么让开发者关注?它有一个其他 AI Agent 框架都没有的核心能力:用得越久,它越聪明。

这篇文章把它的底层逻辑拆给你看。

每个 AI Agent 的共同问题

每个 AI Agent 都有同一个问题:每次开新会话,它忘了所有东西。

你纠正了它三次的代码风格,忘了。你花 10 分钟帮它解决的那个 Bug,忘了。下次再开,又从头来。

这不是某个产品的 Bug,是整个行业都在忍受的架构缺陷。

Nous Research 的 Hermes Agent 选择正面解决这个问题。它不只是"能记忆的 Agent",而是一个会自己写技能、自己管理记忆、还能在离线状态下优化自己的框架。

图片

Hermes 和其他框架最本质的区别

市面上 Agent 框架不少,Hermes 的架构选择跟主流完全不一样。

跟 OpenClaw 的对比最直接——原文里有一句话说得很清楚:"Hermes 是在 Agent 外面包了一个消息网关,OpenClaw 是在消息网关外面包了一个 Agent。"

两种完全相反的设计哲学。Hermes 的核心是那个会学习的 Agent,所有渠道(Terminal、Telegram、API)都只是接入层。

整个系统基于一个单文件 AIAgent 类,通过 run_agent.py 跑起来。这意味着不管你用命令行、消息机器人还是 IDE 插件,底层用的是完全一样的 Agent——不是"相似的 Agent",是同一个。

图片

几个工程细节:

  • 6 种执行环境:本地 Terminal、Docker、SSH、Modal、Daytona、Singularity,配置一行改,代码不动
  • 几乎支持所有主流模型:Claude、GPT、Gemini、Ollama 本地模型,通过统一的翻译层接入,一个命令切换,什么都不会坏
  • 90 轮硬限制:防止 Agent 陷入死循环烧你的 API 钱,子 Agent 也共享这个预算

三层记忆系统

这是 Hermes 最有意思的部分,不是靠一个"记忆 API"解决问题,而是分了三层,各有用途。

图片

第一层:两个小 Markdown 文件

只有两个文件:

  • MEMORY.md(2200 字符上限):Agent 记录的环境信息、项目惯例、工具坑
  • USER.md(1375 字符上限):你的个人档案,沟通偏好、技能水平、雷区

每次会话开始,这两个文件整个塞进 System Prompt。中途写的新记忆当场存盘,但要等下次开会话才生效。

当记忆快满(80% 容量),Agent 会自动合并相近的条目,提炼信息密度,让有用的东西活下来。

第二层:SQLite 全文检索

所有对话(Terminal 和消息渠道)都存在 SQLite 里,支持全文搜索。你可以跨好几周的对话找上下文。

第一层:永远在上下文里,但很小。第二层:容量无限,但要主动搜索。两层互补,而不是互相替代。

第三层:8 个外部记忆插件

对于需要更持久记忆的场景,Hermes 支持 8 个可插拔的记忆提供商。开启之后,Agent 会:每轮之前预取相关记忆,每轮之后同步这轮内容,会话结束后提取关键信息。

图片

Skills:Agent 给自己写使用手册

记忆解决的是"知道什么",Skills 解决的是"怎么做"。

Skills 是带 YAML 头部的 Markdown 文件,本质上就是操作手册:碰到这种情况,按这些步骤做,注意这些坑,最后验证这几点。

一个 k8s 排障的 Skill 长这样:

---
name: k8s-pod-debug
description: >
  Activate for crashing pods, CrashLoopBackOff,
  "why is my pod restarting", container failures.
version: 1.2.0
author: agent
---
## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMKilled, ImagePullBackOff, config errors
## Pitfalls
- Forgetting --previous flag on restarted containers
## Verification
- Pod stays Running with 0 restarts for 5+ minutes

为了省 Token,Skills 用三层渐进式加载:

层级 内容 触发时机
Level 0 名字 + 描述摘要 每轮默认加载,整个目录约 3k tokens
Level 1 完整 Skill 内容 判断需要时加载
Level 2 Skill 内嵌的参考文件 需要深入细节时

图片

自我进化:Agent 自己创建 Skill

这是 Hermes 最核心的差异化能力。

Agent 用 skill_manage 工具自主创建 Skill。触发条件:

  • 完成了一个复杂任务(用了 5 次以上工具调用)
  • 遇到错误或死路,找到了通路
  • 用户纠正了它的做法
  • 发现了一个非显而易见的工作流

逻辑很直接:遇到问题 → 试错解决 → 把成功路径存成 Skill → 下次遇到类似问题直接走已验证的路,不用重新摸索。

图片

Curator:技能库的垃圾收集器

没有维护,技能库会越来越臃肿——几十个窄且重叠的 Skill,既浪费 Token 也污染目录。

Curator 解决这个问题。它不是定时任务,是惰性检查:如果距上次运行超过 7 天,且 Agent 已空闲 2 小时以上,就在后台启动一个独立 Agent 进程,不打扰当前对话。

分两个阶段:

  • 自动转态(不用 LLM,确定性规则):30 天没用的 Skill 变为 stale,90 天变为 archived
  • LLM 审查(最多 8 轮):决定每个 Skill 是保留、修补、合并还是归档

两个重要约束:Curator 不碰官方内置和社区安装的 Skill,只管 Agent 自己创建的。永远不自动删除,最坏结果是归档到 ~/.hermes/skills/.archive/,一个命令就能恢复。

每次 Curator 运行前,Hermes 都会对整个 Skills 目录做 tar.gz 快照备份。

图片

GEPA:离线进化引擎

这是整个体系里最"黑科技"的部分,也是最不被人注意的部分。

运行时的自我学习有个已知弱点:Agent 倾向于对自己的表现过度乐观——几乎永远觉得自己做得不错,哪怕实际上并没有。而且同一个生成 Skill 的系统,也可能把你手动定制的 Skill 覆盖成更差的版本。

GEPA(Genetic-Pareto Prompt Evolution)是这个问题的离线解法。它不内置在运行时里,单独在 NousResearch/hermes-agent-self-evolution 仓库,作为独立优化管道运行。今年拿了 ICLR 2026 Oral。

核心思路:不问 Agent "你觉得你做得好吗",而是读执行轨迹,从里面找到失败原因,再用进化搜索提出针对性改进。

流程:

  1. 读当前 Skill
  2. 生成评估数据集(Claude Opus 合成测试用例,或真实会话历史,或手动黄金集)
  3. GEPA 优化器:读执行轨迹 → 理解失败点 → 生成候选变体
  4. 用 LLM 打分(用评分标准,不是 pass/fail 二元判断)
  5. 限制条件:测试套件必须 100% 通过,Skill 不超过 15KB,语义目的不能漂移
  6. 最佳变体作为 PR 提交,不直接 commit

不需要 GPU。全靠 API 调用。每次优化大概 $2-10。

图片

这是对 GRPO 等 RL 微调路线的一个替代方案——不动模型权重,只优化 Prompt/Skill 文本本身。

快速上手

安装和初始化

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc  # 或 ~/.zshrc

hermes setup  # 交互式设置:模型提供商、API Key、工具配置
hermes        # 开始对话

连接 Telegram

从 @BotFather 获取 Bot Token(运行 /newbot),从 @userinfobot 获取你的 Telegram User ID,然后在 setup 时配置。完成后,手机就能直接跟 Agent 聊了。

图片

~/.hermes/ 目录结构

~/.hermes/
├── config.yaml           # 所有非密钥配置
├── .env                  # API Keys 和密钥
├── SOUL.md               # Agent 身份定义(System Prompt 第一位)
│
├── memories/
│   ├── MEMORY.md         # 持久记忆
│   └── USER.md           # 用户画像
│
├── skills/               # 所有 Skills
│   ├── mlops/
│   ├── devops/
│   └── .hub/
│
├── sessions/             # 会话元数据
├── state.db              # SQLite(FTS5 全文搜索)
├── cron/                 # 定时任务
└── logs/

几个关键文件:config.yaml 是非密钥配置的唯一来源;.env 存密钥;SOUL.md 定义 Agent 人格;state.db 是会话搜索的数据库。

从 1 到 10 个 Agent

单个 Agent 够用,多个专职 Agent 才有意思。

Hermes 有 Profile 系统:每个 Profile 是一个完全独立的 Hermes 实例,有自己的配置、记忆、Skills 和 SOUL.md,默认不共享任何东西。

可以设置三个 Agent:程序员、研究员、设计师。每个 Profile 需要各自的 Telegram Bot。

SOUL.md:给每个 Agent 不同的人格

这是让三个 Agent 真正不同的地方。

图片

设计师的 SOUL.md 关键词是"手绘风格插图,解释 AI/ML 概念,白板草图而非精致营销图"。程序员的是"简洁务实的资深工程师,读代码再写代码,最小改动解决问题"。研究员的是"每日 AI/ML 领域深度摘要,涵盖 GitHub 趋势、大厂动态、新论文、X/Reddit/HN 社区脉搏"。

让程序员 Agent 用 Claude Code 执行

发一条激活提示:

I already have a Claude Max subscription. You are my staff engineer who helps me with my day-to-day coding tasks, and under the hood you use Claude Code for all the executions. Set yourself up accordingly.

Agent 会自己安装 autonomous-ai-agents/claude-code Skill,验证 claude 在 PATH 里,然后所有编码任务都通过 Claude Code 执行。前提是 claude 已经在 PATH 里。

用自然语言设置定时任务

告诉研究员 Agent:

Every weekday at 8am India time, prepare a deep digest of what's new in the AI and machine learning space over the last 24 hours. Cover four streams in this order: Trending GitHub repos, Big tech and lab announcements, Fresh research papers, Social pulse from X/Reddit/HN. Keep it under 800 words. Deliver to Telegram. Set this up as a recurring cron job.

Agent 自动创建定时任务,明天早上 8 点 Telegram 里就有摘要了。

图片

Hermes Skills Hub

Hermes 官方维护了一个 Skills Hub,当前有 687 个 Skills,分 18 个类别:

来源 数量
内置 Skills(默认加载) 87
可选 Skills(按需启用) 79
Anthropic 官方 16
LobeHub 社区 505

可以添加任何 GitHub 仓库作为自定义 Skill 源:

hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/skill-name

团队共享 Skills、维护私有 Skills 库都走这个路径。

图片

社区现状

图片

@aakashgupta 说了一句更直接的话,大意是:

Anthropic 没办法在 Claude Code 里写"切换到 GPT,你的 Skill 文件带走"。OpenAI 也没办法在 ChatGPT 里写"你的记忆存本地,明天切去 Claude"。不锁定供应商的中立运行时,只能由没有模型护城河要守的实验室来做。Nous Research 做了这个东西。

这个判断有意思。闭源 AI 公司做 Agent 框架,天然的利益冲突就在这——你不可能真正中立。

至于 GEPA——建议是:先别管它,等你在运行时的自进化上撞到墙了,再去研究 GEPA。用几千美元解决微调要花几十万的问题,可以考虑。

苏米的总结

Hermes Agent 的三层记忆 + 自写 Skill + GEPA 离线优化,构成了一个完整的"复利飞轮"。用得越久积累越多,而不是每次重置。

现在 2 个月 90K Stars,GitHub 增速超过了 Claude Code。开源 Agent 的格局还在形成中,这个方向值得认真看。

GitHub 仓库:https://github.com/NousResearch/hermes-agent

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Hermes Agent 深度解析:三层记忆 + 自进化 Skill,用得越久越聪明的 AI Agent 框架
#Hermes Agent #AI Agent #记忆系统 
收藏 1
TRAE vs Workbuddy vs Qoderwork:国内三大桌面AI助手横评与选型建议
不会写代码也能做 Skill:手把手拆解去 AI 味 Skill 的实现原理
推荐阅读
  • Anthropic 实战笔记:如何打造可连续运行数小时的多智能体编程系统
  • OpenClaw 升级到 2026.3.24 后,微信 ClawBot 插件更新指南
  • 7 个高质量前端UI设计的 Skills(技能包),让 AI 编程生成高质量UI代码
  • 用飞书官方CLI开发了一套Skills,专门为 AI Agent 设计命令行自动化
  • OpenClaw Skill 管理实践:全局目录 + 软链接 + GitHub+NAS 四层互通方案
评论 (0)
请登录后发表评论
分类精选
Multi-Agent(多智能体)实战:OpenClaw x 飞书机器人,为每个业务场景打造专属多Agent项目协作群
5833 2月前
微信 iLink Bot 协议深度拆解:开发者必备实战手册
3348 1月前
Star-Office-UI:用像素办公室实时可视化 OpenClaw(小龙虾)的工作状态
3050 2月前
OpenClaw 升级到 2026.3.24 后,微信 ClawBot 插件更新指南
2929 1月前
OpenClaw 飞书多 Agent 实战:一只龙虾不够用?教你养一池子龙虾
2915 2月前
微信官方 ClawBot 插件多Agent如何绑定多个微信号?让全家人都用上了OpenClaw!
2735 1月前
即梦CLI:如何用OpenClaw搭建AI工作流实现24小时自动化生图、生视频创作
2628 1月前
新手入门小龙虾(OpenClaw)完整配置指南
2574 2月前
OpenClaw 2026.3.2 版本权限隔离导致工具失效,两招教你满血复活!
2285 2月前
OpenClaw部署全攻略:从本地到云端,解锁HTTPS安全访问
2138 2月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 不会写代码也能做 Skill:手把手拆解去 AI 味 Skill 的实现原理
2 Hermes Agent 深度解析:三层记忆 + 自进化 Skill,用得越久越聪明的 AI Agent 框架
3 从零构建本地AI Agent:可记忆、可扩展、可追踪
4 Harnessclaw本地AI工作台搭建指南
5 Skill开发完全规范指南
6 HTML在Agent生态中崛起:为什么它正在取代PPT成为演示新标准
7 Agent Harness 解析:智能体架构深度拆解
8 Coding Agent 完全指南,Coding Agent从入门到进阶实操教程
9 Harness 实验报告:模型变强后,哪些护栏是必需的?
10 Hermes+Bridge:把Android手机变成AI自动化终端
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联