新浪财经

国投证券-传媒行业:Agent初具技术雏形,重点关注三大演化方向-250520

市场资讯 2025.05.20 16:15

(转自:研报虎)

AGI正迈向自主行动阶段,指向Agent、具身智能。人工智能技术经过几轮迭代,已经基本迈过“感知-思考”的应用临界点,正在逐步实现“自主行动”的发展阶段,根据应用场景划分为Agent、具身智能两个大方向。我们曾以人形机器人为切入点探讨过具身智能相关的技术原理、发展路径、主要参与者等,本篇将聚焦于Agent方向,梳理其技术构成、演进阶段等。

2023年至今国内外模型迭代速度非常快,推动了Agent产品感知、规划、记忆能力提升:1)GPT4、4o模型从单一文本走向多模态,模型感知能力更全面;2)o1通过后训练增强推理能力,模型推理能力实现突破;3)上下文窗口扩展至100万token,模型记忆能力提升,将更了解用户;4)模型使用成本大幅下降,试错成本下降,2025年DeepSeek模型的报价为0.25-0.5元/百万token,约为GPT-4o的1/7。

使用工具的能力是LLM模型与Agent的最大区别,MCP协议有望推动Agent工具生态建立:围绕如何调用工具、交互更加高效为主线,科技大厂先后探索出多种调用工具方式,其中以插件(plugin)、函数调用(Function Calling)、模拟人机交互(Computer use)三种方式最引人关注。2024年Anthropic推出开放协议MCP,屏蔽了不同模式工具与模型通信时的差异,统一由MCP协议转换对接,实现了一次开发、多场景复用的目的,能有效节省研发资源,降低边际开发成本,受到工具、模型及云厂商的广泛认可。

当前处于workflow到Agent的过渡期,类比自动驾驶规则驱动阶段。考虑到当前模型能力有限、业务场景对可控性要求较高,当前许多产品本质上为AIWorkflow,即按照预先定义好的代码路径,协调大模型和各种工具的系统,用于保证交付结果的稳定性。参考自动驾驶方案,我们认为当前可类比于自动驾驶的规则驱动阶段,我们预计真正Agent将实现从被动响应到主动执行的跃迁,进入到模型驱动阶段,进一步地也有望走入感知、决策规划、执行三位一体的端到端模型。

Agent产品还在早期探索阶段,若以前瞻视角讨论商业化,我们认为产业链中以下几条主线值得重点关注:1)模型开源与闭源之争,对大模型厂商商业化能力最为关键;2)科技大厂争先下场,争夺产业链潜在价值点;3)工具层适合中小公司入局,但模型与工具层边界有待清晰。

投资建议:

1)利好算力基础设施,训练垂直场景中长尾模型算力、推理算力等需求将增长,关注商汤阿里巴巴腾讯

2)端侧硬件:手机、PC等硬件终端支持Agent本地部署,对端侧算力要求提升,也将引来换机周期,关注小米集团

3)端侧芯片:手机等终端算力不足,对芯片性能仍有增长需求。

4)To C:个人助手,关注现有C端应用、华为小艺等手机助手的升级迭代,关注小米集团、腾讯;

5)To B:Mass软件平台,用AI重塑SaaS等系统;私有化部署服务商,Agent个性化需求解决仍不足,需要服务商基于客户场景进行私有化定制,关注第四范式、云从科技等;

风险提示:技术进展不及预期、行业竞争加剧、商业模式变化

加载中...