Hermes Agent 重磅升级!现在能装到你电脑上了

Hermes Agent 桌面版

今天凌晨,Nous Research 在推特上甩出了一句话:Hermes Agent 的下一个进化版本来了。这条推文不到半天就冲到了 246 万 浏览量。

主角叫 Hermes Desktop。一句话概括,就是把原来跑在终端里的 Hermes Agent,搬进了一个能双击打开的原生桌面应用。这个东西首次亮相,是在 Jensen Huang 的 GTC 主题演讲上,现在才正式开放公开预览。

Hermes Agent 这个名字,老读者应该不陌生。我前两个月写过两次,一次是它带着 hermes claw migrate 这条迁移命令杀进开源 Agent 赛道,一次是它和 EvoMapAI 的那场抄袭风波。当时它的 Star 还在七八万的量级,如今已经冲到 17.7 万,按 OpenRouter 的调用量统计,它已经是全球用量最大的开源 Agent。

从命令行搬到桌面

要理解 Hermes Desktop 的意义,得先知道 Hermes 之前长什么样。

它本质上是一个跑在你自己机器上的网关进程,加上一堆通信渠道接入。你通过 CLI、Telegram、Discord、Slack 这些入口跟它对话,它在后台调度模型、执行任务、管理记忆。能力很强,但门槛也很实在,至少你得习惯命令行那一套。

桌面版做的事情,就是给这套引擎套上一个正经的图形界面。支持 macOS 12 以上、Windows 10/11 和各种 Linux 发行版。打开应用,正中间是一个大大的 HERMES AGENT 标题,下面一行提示语:把问题、文件或者想法发给我,我会按你配置好的人格来执行。

左边的侧栏值得多看两眼。除了新建 Agent,还有 Skills(技能)、Messaging(消息渠道)、Artifacts(产物)这几个入口,以及一份 Agents 列表。注意右下角的状态栏,Gateway ready、Agents、Cron 几个状态常驻,最右边写着当前跑的模型是 Nemotron 3 Super。这些细节后面再说。

桌面版到底带来了什么

桌面版这次的重点功能可以拆成这么几块:

  • 原生应用外壳:基于 Electron 打包,但跟后台网关是实时连接,不是简单套个网页
  • 流式对话:回复边生成边显示,工具调用以内联卡片的形式嵌在对话里,连模型的推理过程都能展开看
  • 主题引擎:内置六套皮肤,Nous、Midnight、Ember、Mono、Cyberpunk、Slate,每套还能切换明暗模式
  • 命令面板:一个快捷键唤起的导航条,在各个会话和功能之间瞬移
  • 应用内一键更新:不用再去敲命令重装,桌面里点一下就升级

下面这张图是演示里最能说明问题的一幕。用户让 Hermes 帮忙写桌面版的发布说明,它先跑了一条命令去翻最近的提交记录,然后整理出五个头条特性加上常规修复,反问要不要直接起草完整的 changelog 并开 PR。用户说好,它就写好了 RELEASE_NOTES.md,提交到分支,开出了 PR #482,还在摘要里给发布视频留好了位置。

工具调用卡片、推理过程的折叠展开,全都直接体现在这段对话里。这就是流式对话加内联工具卡的实际样子。

主题这块也不是随口说说。设置页里那六套配色是真做了,每一套都给了一句定位描述,比如 Ember 是暖红配青铜的锻造风,Cyberpunk 是黑底霓虹绿的矩阵终端风。设置页顶部还有一个挺贴心的开关,叫 Tool Call Display,可以在 Product 和 Technical 之间切换,前者只给你看人话版的工具活动摘要,后者把原始的工具参数和返回值全摊开。给产品用户和开发者各留了一个档位。

不只是给 CLI 套了层壳

如果桌面版只是把命令行包装一下,那也就是个锦上添花。但有两个细节说明它想得更远。

一是多 Agent 看板被真正搬上了界面。侧栏的 Agents 列表里挂着十个任务,从修 arm64 上的 CI、重构鉴权中间件,到把 Postgres 迁到 SQLite、起草发布推文,一字排开。更进一步,这些 Agent 还能按项目分组,hermes-agent、dataplatform、webapp、marketing 各管各的。这正是 Hermes 前阵子上线的多 Agent 任务编排能力,过去只能在终端里感知,现在变成了一块看得见摸得着的任务面板。

二是图形界面和命令行并存,而不是二选一。下面这张图里,用户让 Hermes 给启动页画一张自己的肖像,它生成了一张像素风的信使骑士,戴着带翅膀的头盔,手持双蛇杖,对应的正是 Hermes 这个名字在神话里的形象。而右半边窗口直接嵌着一个 ZSH 终端,里面还在跑 hermes run "summarize recent commits" 这条命令。图像生成、内置终端、对话区,三者在同一个窗口里同时工作。

加上侧栏里的 Skills、Messaging、Artifacts,可以看出桌面版的野心,是把 Hermes 这一年攒下来的技能系统、记忆、多渠道、定时任务全都收进一个统一的工作台,而不只是给老用户换个皮肤。

跑在本地模型上,背后站着 NVIDIA

回到前面留的那个尾巴,状态栏里的 Nemotron 3 Super。

Nemotron 是 NVIDIA 自家的开源模型系列。Hermes Desktop 的演示直接跑在 Nemotron 3 Super 上,这个组合不是随便选的。Hermes 一向主打本地化和模型自由,官方支持的模型超过 300 个,从 OpenAI、Anthropic 到 OpenRouter 上的各路开源模型都能接。而它和 NVIDIA 的绑定,在那场 GTC 演讲里就埋下了伏笔。

NVIDIA 自己的博客也把 Hermes 拿出来讲过,重点是两件事。一是 Hermes 会自己写技能、自己改技能,每次碰到复杂任务或者拿到反馈,就把经验沉淀成一条新技能,这套自我学习的循环正是它区别于其他 Agent 的核心。二是配合 RTX PC 和 DGX Spark 这类硬件,本地推理能把原本要几分钟的任务压到几秒钟。换句话说,NVIDIA 想讲的故事是:一台够强的本地机器,加上一个会自我进化的开源 Agent,就能在你自己的电脑上跑起一个真正能干活的助手。Hermes Desktop 就是这个故事最直观的载体。

热闹归热闹,说几句实话

得先说清楚,它现在是公开预览版,主程序版本号才到 0.15。社区里已经有人反馈界面卡顿、任务优先级乱排,还有人的杀毒软件直接报了警。早期桌面应用这些毛病都正常,拿来尝鲜没问题,真要把重要的活交给它,再等等。

而且平心而论,给一个开源 Agent 套个桌面应用,技术上不算难事。Electron 加网关连接是现成的活,谁都能做。Hermes 真正押注的东西不在这层壳上,而在它那套会自己写技能、自己改技能的学习循环。这套机制到底跑没跑通,是不是真的用得越久越顺手,桌面版回答不了,得靠时间。

桌面版解决的是另一个问题:以前 Hermes 是给肯折腾命令行的人用的,门槛把一大批人挡在外面;现在双击就能打开,能用的人一下子多了。Jensen 愿意在 GTC 上拿它演示,NVIDIA 又在模型和硬件两头给它撑腰,这些都是命令行时代换不来的曝光。

两个多月前我写它的时候 Star 还在七八万,现在 17.7 万,OpenRouter 上的调用量也坐到了开源 Agent 的头把交椅。势头是真猛,但预览版终究是预览版。它能不能接住这波关注,就看正式版什么时候能让人放心地把手里的活儿丢给它了。

Leave a Reply

Your email address will not be published. Required fields are marked with *