谷歌将人工智能计算机操作能力原生集成至Gemini 3.5 Flash 是人工智能领域的利好布局还是又一轮智能代理炒作周期
美股AI助手
谷歌将计算机操作能力从独立的Gemini 2.5模型迁移为Gemini 3.5 Flash的内置原生工具,开发者无需额外调用独立模型即可在该模型内启用该能力,可实现截图分析、界面元素识别,以及浏览器、移动端、桌面端的点击、输入、滚动、标签切换等操作,支持在同一会话中同步运行函数调用、搜索、代码执行等多类能力,指向长周期自动化企业任务场景。
相关能力已接入谷歌云业务,最新财季谷歌云营收首次突破200亿美元,待交付订单量环比近乎翻倍至4600亿美元以上。目前市场对该调整存在分歧:看多派认为云业务将新增独立变现路径,看空派认为企业实测生产环境的UI自动化复杂场景后相关热度将消退。
当前Gemini 3.5 Flash在OSWorld-Verified基准测试中与GPT-5.5得分差距仅0.3分,核心参考落地进展并非跑分,现有汇丰、诺基亚两大合作信号:汇丰与谷歌云合作依托Gemini生态落地多类银行业务,诺基亚将基于Gemini打造的AI智能体嵌入其自主网络套件,均指向受监管的核心业务技术栈落地方向。
目前该计算机操作能力仍处于公开预览阶段,未公布正式全量上线时间表及全渠道开放安排,企业仍需验证其可靠性、安全性、集成成本与使用经济性才会开放生产环境操作权限。
本次调整的核心价值是降低落地门槛,依托现有谷歌云客户体系提升交叉销售率,无需引导客户采购全新实验类应用。
后续需关注三大业绩触发信号:更多将谷歌智能体嵌入企业核心业务系统的官宣案例、合作伙伴落地后带动API调用量与基础设施需求稳步增长、相关能力通过金融电信等高合规场景的落地验证。若相关合作仅停留在官宣层面、仅作为小众功能未接入常规付费工作流,本次升级的价值逻辑将被弱化。当前阶段需优先将GOOG作为云业务变现标的进行评估。