国投证券-传媒行业：Agent初具技术雏形，重点关注三大演化方向-250520

市场资讯 2025.05.20 16:15

（转自：研报虎）

AGI正迈向自主行动阶段，指向Agent、具身智能。人工智能技术经过几轮迭代，已经基本迈过“感知-思考”的应用临界点，正在逐步实现“自主行动”的发展阶段，根据应用场景划分为Agent、具身智能两个大方向。我们曾以人形机器人为切入点探讨过具身智能相关的技术原理、发展路径、主要参与者等，本篇将聚焦于Agent方向，梳理其技术构成、演进阶段等。

2023年至今国内外模型迭代速度非常快，推动了Agent产品感知、规划、记忆能力提升：1)GPT4、4o模型从单一文本走向多模态，模型感知能力更全面；2)o1通过后训练增强推理能力，模型推理能力实现突破；3)上下文窗口扩展至100万token，模型记忆能力提升，将更了解用户；4)模型使用成本大幅下降，试错成本下降，2025年DeepSeek模型的报价为0.25-0.5元/百万token，约为GPT-4o的1/7。

使用工具的能力是LLM模型与Agent的最大区别，MCP协议有望推动Agent工具生态建立：围绕如何调用工具、交互更加高效为主线，科技大厂先后探索出多种调用工具方式，其中以插件(plugin)、函数调用(Function Calling)、模拟人机交互(Computer use)三种方式最引人关注。2024年Anthropic推出开放协议MCP，屏蔽了不同模式工具与模型通信时的差异，统一由MCP协议转换对接，实现了一次开发、多场景复用的目的，能有效节省研发资源，降低边际开发成本，受到工具、模型及云厂商的广泛认可。

当前处于workflow到Agent的过渡期，类比自动驾驶规则驱动阶段。考虑到当前模型能力有限、业务场景对可控性要求较高，当前许多产品本质上为AIWorkflow，即按照预先定义好的代码路径，协调大模型和各种工具的系统，用于保证交付结果的稳定性。参考自动驾驶方案，我们认为当前可类比于自动驾驶的规则驱动阶段，我们预计真正Agent将实现从被动响应到主动执行的跃迁，进入到模型驱动阶段，进一步地也有望走入感知、决策规划、执行三位一体的端到端模型。

Agent产品还在早期探索阶段，若以前瞻视角讨论商业化，我们认为产业链中以下几条主线值得重点关注：1)模型开源与闭源之争，对大模型厂商商业化能力最为关键；2)科技大厂争先下场，争夺产业链潜在价值点；3)工具层适合中小公司入局，但模型与工具层边界有待清晰。

投资建议：

1)利好算力基础设施，训练垂直场景中长尾模型算力、推理算力等需求将增长，关注商汤、阿里巴巴、腾讯；

2)端侧硬件：手机、PC等硬件终端支持Agent本地部署，对端侧算力要求提升，也将引来换机周期，关注小米集团；

3)端侧芯片：手机等终端算力不足，对芯片性能仍有增长需求。

4)To C：个人助手，关注现有C端应用、华为小艺等手机助手的升级迭代，关注小米集团、腾讯；

5)To B：Mass软件平台，用AI重塑SaaS等系统；私有化部署服务商，Agent个性化需求解决仍不足，需要服务商基于客户场景进行私有化定制，关注第四范式、云从科技等；

风险提示：技术进展不及预期、行业竞争加剧、商业模式变化