新浪科技

老黄也来养马了!英伟达版Hermes Agent发布

创事记

关注

听雨 发自 凹非寺

量子位 | 公众号 QbitAI

英伟达版Hermes Agent也来了!

今天凌晨,英伟达官方连发两条帖子,力推Hermes Agent+NemoClaw方案

这咋说呢…老黄你最终还是对Hermes下手了哈。

直接哐哐两支视频,教你把Hermes配上英伟达自家的部署方案,做一个“会自我进化、还跑得安全”的企业级AI。

官方X上发的那条视频,长达55分钟,技术博客、代码仓库什么的,也都一应俱全了。

由于视频太长,实在是看不完。

于是我总结了一下,英伟达版Hermes Agent的核心主要有三件事:

越用越聪明、数据不出本地、学到的技能重装系统都忘不掉

英伟达版Hermes Agent,有啥特别?

这次发布的主角呢,就是大名鼎鼎的Hermes

如果你要问Hermes是什么,我只能说…

不会吧不会吧,不会还有人不知道Hermes是什么吧??

咳咳,正经解释一下,Hermes是Nous Research开源的agent框架,MIT协议,代码完全公开。

目前在github上也是跑到17万星了。

自从Hermes释出之后,不少人觉得它比OpenClaw更加稳定,所以热度一直只增不减。

在最近的GTC Taipei上,老黄在发布RTXSpark时,也把Hermes和OpenClaw并列提及。

Hermes最核心的设计,是一套内置的学习闭环

完成一个复杂任务之后,它会把自己的做法总结成一个技能存下来,下次遇到类似的事直接调用,不用再从头摸索。

用的时间越长,积累的技能越多,越趁手。

更厉害的是,Hermes还会随着时间建立一个“你是谁、你习惯怎么工作”的用户模型。

版本较新的Hermes还有一个自主运行的Curator,会按周期给技能库打分、合并重复的、归档过时的,让整个库保持干净。相当于agent自己在给自己做性能调优。

那么这次,英伟达给它配了一套完整的企业级装备:

NemoClaw作为整体部署蓝图,OpenShell在里面负责安全沙箱,底层推理默认跑Nemotron3Super模型。

从消费级的RTXPC到企业级的DGXSpark,整套方案主打全本地运行。

整个架构主要分为三层:

  • 模型层(Nemotron 3 Super 120B-A12B):负责推理、选工具、起草回复;

  • Harness层(Hermes):负责技能、记忆、会话管理、消息桥接;

  • 运行时层(OpenShell):负责文件和网络策略、凭证代理、沙箱隔离。

使用场景上,英伟达特意出了个官方视频,来演示如何把它接入Slack、Outlook、GitHub和NVIDIA开发者论坛。

大家可以看看:

里面也演示了Hermes的自我进化能力

比如你让agent每天拉一份GitHub issue日报,它回了一堆散装文字,格式太乱。

你说:

我只要5个issue加3个讨论,每条带编号、标题、状态、链接和一句话说明。

它给的格式对了,你就顺口夸一句:

对,以后都这样。

就这一句夸,Hermes自己就写了个SKILL.md文件存了下来。

第二天换个全新的对话窗口,同样的问题问下去,格式直接对了,数据是最新的,完全不需要重说之前的要求。

因为它存进了技能文件,而不是那次对话的记忆里。就算把沙箱整个删掉、重建、恢复,但技能还在。

那么,如何部署呢?

官网给出了一行命令:

curl -fsSL https://www.nvidia.com/nemoclaw.sh | NEMOCLAW_AGENT=hermes bash

如果你实在懒得打命令行,官网也提供了其他方式:

Help me install nvidia.com/nemoclaw

直接把这行命令复制给你的AI助手,让它帮你装上。

这行命令能拉起Hermes+NemoClaw的基础环境,但要复现演示里的四路数据源接入,还需要额外的配置步骤,具体可以参考技术博客。

演示的视频里接的是四个数据源(Slack、Outlook、GitHub、英伟达开发者论坛),但社区仓库里能接的远不止这些:

Google Workspace全家桶(Gmail、日历、Drive、Docs、Sheets)、实时航班追踪、卫星图像(Planet)、定时唤醒任务……

还有一个多模态版本,把Hermes接上Nemotron Omni,直接能处理视频、音频、图片和PDF。

基本上,你想接什么数据源,自己加集成就行。

主打一手安全牌

讲真,“越用越聪明”这件事对企业来说不是最大的顾虑。

他们担心的主要问题是:这玩意儿能不能别把内部数据传出去?

英伟达这套方案在安全上做了几层设计,而且有意思的地方在于,它的安全靠的是策略代码,而非靠模型自觉

这部分在技术博客中也有详细说明。

首先,agent根本看不到你的Slack或Outlook令牌

鉴权发生在沙箱代理的出口,token压根不会进入agent的视野。agent只管发出请求,真正的凭证由外面的代理注入,两者隔离。

其次,能接触内部敏感数据的agent,被硬性禁止访问公网

就算这个agent哪天出了什么问题被人钻了空子,它也没有路径把数据发出去。

演示里的GitHub数据和论坛数据,是另走ETL流程同步好存下来,agent只有只读权限,不能主动拉取外部信息。

图片由AI生成

第三,网络策略写在一个policy.yaml文件里:哪些主机、哪些端口、哪些HTTP方法——全部列死。

agent想碰白名单以外的目标,代理会直接返回403,Hermes把它当成一次普通的工具报错处理,连闹幺蛾子的机会都没有。

最后是可观测性

agent每一步的决策——用了哪个技能、调了哪个工具、传了什么参数、回了什么——都会以轨迹的形式记录下来,通过NeMo Relay和Arize Phoenix查看。

出了问题不是黑盒,有迹可查。

英伟达盯上Hermes,不是一天两天了

本来文章到这里就差不多结束了。

但经过一番深扒,我发现英伟达早就对Hermes Agent有想法了。

如果把时间线往前翻一翻,会发现英伟达在5月13日发布了一篇博客。

这篇博客的内容是,把Hermes优化适配到了RTX PC和DGX Spark上,走的是面向个人开发者的消费侧路线,配的模型是阿里的Qwen 3.6。

而在5月31日的GTC Taipei,英伟达又来了一波:

发布了面向个人agent的Windows PC新品RTX Spark,把OpenShell运行时带上Windows,NemoClaw蓝图扩展到全线RTX和DGX产品。

同时,也宣布Hermes Agent和OpenClaw都将把OpenShell集成进各自即将推出的Windows原生应用

这背后反映出一个大的趋势:英伟达也在抢agent入口

从“卖芯片、扔个模型权重让你自己折腾”,一路往上做到了模型+蓝图+安全运行时+技能库这一层。

谁掌握了好用又安全的部署层,谁就掌握了agent时代真正的入口。

但说到底,当agent从一次性的问答工具变成常驻的、会越来越了解你工作习惯的“同事”——

企业敢不敢把数据交给会自己写技能的agent,才是真考验

参考链接:

[1]https://x.com/NVIDIAAI/status/2061870499232190967

[2]https://x.com/NVIDIAAI/status/2061858457519575280

[3]https://developer.nvidia.com/blog/deploy-self-evolving-agents-for-faster-more-secure-research-with-a-hermes-agent-and-nvidia-nemoclaw

[4]https://github.com/NVIDIA/nemoclaw-community

加载中...