文章

Hermes Agent 专题(上):这个 3 万星的 AI Agent 到底强在哪

Hermes Agent 专题(上):这个 3 万星的 AI Agent 到底强在哪

这是 Hermes Agent 专题的第一篇。上篇讲它是什么、为什么值得关注;中篇讲安装配置和 OpenClaw 迁移;下篇讲高效使用技巧。

两个月不到,GitHub 近 3 万星。Nous Research 开源的 Hermes Agent 正在成为 AI Agent 赛道最值得关注的项目之一。

它不是又一个套壳 ChatGPT 的终端工具。它有自己的学习闭环——用得越多越聪明,能自动创建 Skill、改进 Skill、跨会话记忆、建立用户画像。跑在 $5 的 VPS 上,从 Telegram 发消息就能指挥它干活。

谁做的

Nous Research 是 Hermes、Nomos、Psyche 等开源模型背后的研究实验室。做模型训练的人做出来的 Agent——这个出身本身就值得注意。

他们不是在 API 上面套壳,而是从模型能力边界出发,设计了一套让 Agent 真正”学会”的机制。

核心定位

一句话:一个会自我进化的 AI 助手

不是 IDE 插件,不是聊天机器人,是一个能独立运行、持续学习、跨平台工作的自主 Agent。它不绑定你的笔记本——可以跑在 $5 的 VPS 上,你从手机上发消息就能指挥它。

六大核心特性

1. 闭环学习系统

这是 Hermes 最独特的能力,也是它和其他 Agent 拉开差距的地方。

它有三层记忆:

  • MEMORY.md / USER.md:持久化记忆,跨会话保留。Agent 自己管理,自动记录你的偏好、环境、工作习惯。MEMORY.md 存 Agent 的笔记(环境、约定、经验),USER.md 存你的画像(偏好、风格、技术栈)
  • Skills 系统:程序化记忆。完成复杂任务后(通常 5+ 步工具调用),Agent 自动把工作流程固化成 Skill。下次遇到类似任务,直接 /skill-name 调用。更关键的是——Skill 会在使用中自我改进
  • Session Search:FTS5 全文搜索 + LLM 摘要。所有历史对话存在 SQLite 里,能搜索几周前的对话内容。”我们上周讨论的那个部署方案是什么来着?”——它能找到

这三层加起来,意味着 Hermes 用得越久越好用。它不只是记住你说过什么,而是把经验转化成可复用的能力。

还有一个可选的 Honcho 集成,做辩证式用户建模——不只记录你说了什么,而是理解你为什么这么说。

2. 不绑定你的笔记本

六种终端后端:

后端 适用场景
local 本地开发,默认选项
Docker 安全隔离,CI/CD
SSH 远程服务器
Modal 无服务器云计算,按需付费
Daytona 托管云开发环境
Singularity HPC 集群

Modal 和 Daytona 支持 serverless 持久化——空闲时休眠,按需唤醒,闲置成本几乎为零。你可以把 Agent 部署在云端 VM 上,自己从 Telegram 发消息指挥它工作,完全不需要 SSH 上去。

3. 全平台消息网关

CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、飞书、企业微信、BlueBubbles、Home Assistant——15+ 平台,一个 Gateway 进程搞定。

语音备忘录自动转文字,跨平台对话连续性。在 Telegram 上开始的对话,可以在 Discord 上继续。

4. 模型自由

支持 20+ 提供商:

  • 海外:Nous Portal、OpenRouter(200+ 模型)、OpenAI、Anthropic、GitHub Copilot、Hugging Face、Arcee AI
  • 国内:DeepSeek、Kimi/Moonshot、MiniMax、阿里云 DashScope
  • 自部署:VLLM、SGLang、Ollama 等 OpenAI 兼容端点

hermes model 一条命令切换,零代码改动,零锁定。

唯一硬性要求:模型上下文窗口 ≥ 64K tokens。

5. 47+ 内置工具

Web 搜索、文件操作、终端命令、代码执行、图片生成、TTS、浏览器控制……开箱即用。

还支持 MCP(Model Context Protocol)接入外部工具。GitHub、数据库、Kubernetes——只要有 MCP Server,就能接进来。

工具按 toolset 分组管理,可以按需启用/禁用:

1
hermes tools  # 交互式配置工具集

6. 定时任务

内置 cron 调度器,自然语言配置,结果可以推送到任意平台。

“每天早上 9 点检查 Hacker News 的 AI 新闻,总结发到 Telegram”

一句话搞定。Agent 自动创建 cron job,通过 Gateway 推送结果。

和其他 Agent 的区别

市面上 AI Agent 不少,Hermes 的差异化在哪?

vs Claude Code / Codex:这些是 IDE 级别的 coding agent,绑定终端或编辑器。Hermes 是独立运行的全能 Agent,不限于写代码。

vs OpenClaw:OpenClaw 是多渠道 AI 网关,强在消息路由和渠道集成。Hermes 强在自我学习和 serverless 部署。两者可以共存。

vs AutoGPT / AgentGPT:早期 Agent 项目,缺乏持久化记忆和学习能力。Hermes 的闭环学习系统是本质区别。

vs 各种 ChatGPT wrapper:Hermes 有真正的工具调用、终端执行、文件操作能力,不是简单的 API 转发。

技术架构一瞥

Hermes 是 Python 项目,核心架构:

  • Agent Loop:标准的 observe-think-act 循环,支持中断和重定向
  • Tool System:47+ 内置工具,按 toolset 分组,支持 MCP 扩展
  • Memory System:有界记忆(MEMORY.md + USER.md)+ 无界搜索(Session Search)+ 可选外部提供商(Honcho 等 8 种)
  • Skills System:兼容 agentskills.io 开放标准,Skills 可跨 Agent 共享
  • Gateway:多平台消息网关,支持语音、图片、文件
  • Subagent:支持派发子任务并行执行

开源协议 MIT,代码在 GitHub

值得关注的原因

  1. 出身正:Nous Research 做模型训练,对模型能力边界有深刻理解
  2. 学习闭环是真的:不是噱头,Skills 自动创建和改进是可验证的
  3. 生态开放:agentskills.io 标准、MCP 支持、多模型多平台
  4. 部署灵活:从 $5 VPS 到 GPU 集群,从本地到 serverless
  5. 社区活跃:3 万星不是刷的,Discord 讨论质量高

下一篇讲怎么装、怎么配,包括从 OpenClaw 迁移的完整指南。

项目地址:github.com/NousResearch/hermes-agent

官方文档:hermes-agent.nousresearch.com/docs

专题导航:上篇(本文) · 中篇:配置与迁移 · 下篇:高效使用

本文由作者按照 CC BY 4.0 进行授权