Hermes Agent 专题(上):这个 3 万星的 AI Agent 到底强在哪
这是 Hermes Agent 专题的第一篇。上篇讲它是什么、为什么值得关注;中篇讲安装配置和 OpenClaw 迁移;下篇讲高效使用技巧。
两个月不到,GitHub 近 3 万星。Nous Research 开源的 Hermes Agent 正在成为 AI Agent 赛道最值得关注的项目之一。
它不是又一个套壳 ChatGPT 的终端工具。它有自己的学习闭环——用得越多越聪明,能自动创建 Skill、改进 Skill、跨会话记忆、建立用户画像。跑在 $5 的 VPS 上,从 Telegram 发消息就能指挥它干活。
谁做的
Nous Research 是 Hermes、Nomos、Psyche 等开源模型背后的研究实验室。做模型训练的人做出来的 Agent——这个出身本身就值得注意。
他们不是在 API 上面套壳,而是从模型能力边界出发,设计了一套让 Agent 真正”学会”的机制。
核心定位
一句话:一个会自我进化的 AI 助手。
不是 IDE 插件,不是聊天机器人,是一个能独立运行、持续学习、跨平台工作的自主 Agent。它不绑定你的笔记本——可以跑在 $5 的 VPS 上,你从手机上发消息就能指挥它。
六大核心特性
1. 闭环学习系统
这是 Hermes 最独特的能力,也是它和其他 Agent 拉开差距的地方。
它有三层记忆:
- MEMORY.md / USER.md:持久化记忆,跨会话保留。Agent 自己管理,自动记录你的偏好、环境、工作习惯。MEMORY.md 存 Agent 的笔记(环境、约定、经验),USER.md 存你的画像(偏好、风格、技术栈)
- Skills 系统:程序化记忆。完成复杂任务后(通常 5+ 步工具调用),Agent 自动把工作流程固化成 Skill。下次遇到类似任务,直接
/skill-name调用。更关键的是——Skill 会在使用中自我改进 - Session Search:FTS5 全文搜索 + LLM 摘要。所有历史对话存在 SQLite 里,能搜索几周前的对话内容。”我们上周讨论的那个部署方案是什么来着?”——它能找到
这三层加起来,意味着 Hermes 用得越久越好用。它不只是记住你说过什么,而是把经验转化成可复用的能力。
还有一个可选的 Honcho 集成,做辩证式用户建模——不只记录你说了什么,而是理解你为什么这么说。
2. 不绑定你的笔记本
六种终端后端:
| 后端 | 适用场景 |
|---|---|
| local | 本地开发,默认选项 |
| Docker | 安全隔离,CI/CD |
| SSH | 远程服务器 |
| Modal | 无服务器云计算,按需付费 |
| Daytona | 托管云开发环境 |
| Singularity | HPC 集群 |
Modal 和 Daytona 支持 serverless 持久化——空闲时休眠,按需唤醒,闲置成本几乎为零。你可以把 Agent 部署在云端 VM 上,自己从 Telegram 发消息指挥它工作,完全不需要 SSH 上去。
3. 全平台消息网关
CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、飞书、企业微信、BlueBubbles、Home Assistant——15+ 平台,一个 Gateway 进程搞定。
语音备忘录自动转文字,跨平台对话连续性。在 Telegram 上开始的对话,可以在 Discord 上继续。
4. 模型自由
支持 20+ 提供商:
- 海外:Nous Portal、OpenRouter(200+ 模型)、OpenAI、Anthropic、GitHub Copilot、Hugging Face、Arcee AI
- 国内:DeepSeek、Kimi/Moonshot、MiniMax、阿里云 DashScope
- 自部署:VLLM、SGLang、Ollama 等 OpenAI 兼容端点
hermes model 一条命令切换,零代码改动,零锁定。
唯一硬性要求:模型上下文窗口 ≥ 64K tokens。
5. 47+ 内置工具
Web 搜索、文件操作、终端命令、代码执行、图片生成、TTS、浏览器控制……开箱即用。
还支持 MCP(Model Context Protocol)接入外部工具。GitHub、数据库、Kubernetes——只要有 MCP Server,就能接进来。
工具按 toolset 分组管理,可以按需启用/禁用:
1
hermes tools # 交互式配置工具集
6. 定时任务
内置 cron 调度器,自然语言配置,结果可以推送到任意平台。
“每天早上 9 点检查 Hacker News 的 AI 新闻,总结发到 Telegram”
一句话搞定。Agent 自动创建 cron job,通过 Gateway 推送结果。
和其他 Agent 的区别
市面上 AI Agent 不少,Hermes 的差异化在哪?
vs Claude Code / Codex:这些是 IDE 级别的 coding agent,绑定终端或编辑器。Hermes 是独立运行的全能 Agent,不限于写代码。
vs OpenClaw:OpenClaw 是多渠道 AI 网关,强在消息路由和渠道集成。Hermes 强在自我学习和 serverless 部署。两者可以共存。
vs AutoGPT / AgentGPT:早期 Agent 项目,缺乏持久化记忆和学习能力。Hermes 的闭环学习系统是本质区别。
vs 各种 ChatGPT wrapper:Hermes 有真正的工具调用、终端执行、文件操作能力,不是简单的 API 转发。
技术架构一瞥
Hermes 是 Python 项目,核心架构:
- Agent Loop:标准的 observe-think-act 循环,支持中断和重定向
- Tool System:47+ 内置工具,按 toolset 分组,支持 MCP 扩展
- Memory System:有界记忆(MEMORY.md + USER.md)+ 无界搜索(Session Search)+ 可选外部提供商(Honcho 等 8 种)
- Skills System:兼容 agentskills.io 开放标准,Skills 可跨 Agent 共享
- Gateway:多平台消息网关,支持语音、图片、文件
- Subagent:支持派发子任务并行执行
开源协议 MIT,代码在 GitHub。
值得关注的原因
- 出身正:Nous Research 做模型训练,对模型能力边界有深刻理解
- 学习闭环是真的:不是噱头,Skills 自动创建和改进是可验证的
- 生态开放:agentskills.io 标准、MCP 支持、多模型多平台
- 部署灵活:从 $5 VPS 到 GPU 集群,从本地到 serverless
- 社区活跃:3 万星不是刷的,Discord 讨论质量高
下一篇讲怎么装、怎么配,包括从 OpenClaw 迁移的完整指南。
项目地址:github.com/NousResearch/hermes-agent
