新浪财经 股票

谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了

市场资讯 05.25 14:18

(来源:钛媒体APP)

作者|林易 编辑|重点君

谷歌I/O大会落幕后,谷歌首席执行官Sundar Pichai接受了知名科技播客Hard Fork的专访。

对于外界最关注的谷歌大模型能力,Pichai表示,谷歌模型在整体智能上极具竞争力,但在代理式编程(agentic coding)和长周期任务方面,依然落后于行业前沿水平。新发布的Gemini 3.5 Flash模型存在伪影和性能退化问题,团队正在通过后训练进行快速修复。

我们梳理了这场访谈的核心信息,以下是重点内容:

1.谷歌模型的多模态能力处于前沿,但编程与长周期任务能力落后

针对外界对谷歌大模型实力的关注,Pichai说,谷歌的模型在文本、多模态输入、语音与音频处理,以及通用推理等整体智能维度上,均处于行业极具竞争力的前沿水平。但在代理式编程(agentic coding)、指令遵循以及长周期任务处理方面,谷歌目前暂时落后。资深开发者在复杂代码库上执行的长期任务,是谷歌当前必须坚守并全力追赶的重要阵地。

此外,针对刚发布的Gemini 3.5 Flash模型出现的性能退化和行为异常问题,Pichai表示这是新领域探索中的常见现象,团队将通过后训练迅速修复,并逐步放宽为防范服务中断而设置的使用限制。

2.谷歌搜索不会激进切换至全AI模式,来源和链接将长期存在

谷歌不会采取激进的方式将搜索切换到全AI模式。Pichai说,引导用户共同经历技术变革,确保产品符合用户预期至关重要。虽然谷歌正在全面推进AI,但用户依然需要搜索节点这种快速建立联系的方式,因此来源和链接将始终作为搜索的一部分而存在。

在商业模式层面上,Pichai认为,经济价值始终取决于技术为用户提供的价值总量,而在AI模式下,智能体将比过去为用户创造更多的总价值。因此,谷歌将持续采用订阅与广告相结合的商业模式,这一商业规律在新技术周期中并不会发生改变。

3.谷歌智能体产品将采用渐进式推广策略,以赢取用户信任,防范黑客攻击

谷歌最新智能体产品Spark计划于今年夏天发布,Pichai分享了他个人测试体验:Spark能够自主读取会议安排,直接在日历中按类别进行颜色编码,清晰标记出不同的会议类别及工作时间。

在谈到智能体的推广策略时,Pichai说,赢得用户信任的关键在于分步推进,向人们提供绝对的掌控感和系统透明度。如果智能体发生了意料之外的行为,用户就会产生退缩心理。此外,从安全角度来看,智能体系统存在被外部黑客攻击的隐患,因此在技术推进过程中必须确保边界安全,避免以错误的方式越界。

4.谷歌向竞争对手开放TPU算力,以保持硬件前沿优势

为了满足模型迭代的庞大算力需求,谷歌在供应自研模型的同时,依然向竞争对手和外部公司出售TPU芯片的访问权限。提供技术能让谷歌保持在最前沿,促使团队开发出最好的下一代硬件,并在各个方面获得规模经济优势。如果缺乏庞大的外部云业务支撑,公司无论如何也不会去规划如此高产量的芯片制造。

5.AGI过去一两年的演进速度已超出原有预期

底层技术向AGI迈进是正在发生的必然趋势。虽然Pichai并未给出实现AGI的确切时间表,但他承认,过去一两年的技术演进速度超出了原有的预期,让这一目标的实现节点显得更近。即使完全实现AGI还需要时间,三年后的技术也将比今天强大得多,因此社会公众不能因为认为实现AGI尚需时日就放松准备,整个社会必须提前做好内化与应对的准备。

以下是Sundar Pichai访谈实录:

1.谷歌在AI竞赛中的模型能力评估

Kevin Roose:Sundar Pichai,欢迎回到Hard Fork。

Sundar Pichai:感谢邀请,很高兴来到这里。

Kevin Roose:我们上一次请你参加节目是在2023年。当时Bard刚刚发布,我想当时人们的普遍看法是Google在AI领域正处于追赶状态。你现在如何看待你们在这场竞赛中的地位?

Sundar Pichai:这勾起了我的回忆。感觉那已经是很久以前的事了,这三年感觉过了很久。但我认为,看到这项技术所取得的进展是惊人的。作为一家公司,我们也取得了长足的进步。我认为对于整个行业来说,这是一个充满活力的时刻。

我们的模型在某些领域处于前沿水平,在某些领域我们也落后于前沿水平,这是一种并存的状态。如果你观察包括文本、多模态在内的整体能力、语音或音频,以及通用的推理能力,在整体智能方面,我认为我们非常有竞争力。当涉及到结合工具使用的代理式编程(agentic coding)以及指令遵循、长周期任务时,我认为我们目前稍微落后了一点。

但我们正在努力工作。这个领域充满了活力,所有领先的实验室都有各自的预训练周期,所以会有不同的节奏,且可能并不完全匹配。当下的竞争非常激烈,三个月前人们还在说“我们处于领先地位,没有人能赶上我们”,然后现在的舆论风向就反转了。但这就是处于前沿领域必须面对的常态。

我们是唯一一家真正处于该前沿领域的大型公司。目前有几家初创公司取得了非凡的进展。我们在这方面已经深耕很久了,我认为我们在Gemini 3.5 Flash上迈出了一大步,它确实解决了一些我们之前落后的领域。将模型推向现实世界,并根据反馈回来的数据进行迭代,对我们非常有帮助。

我认为编程是一个获取数据流访问权限非常重要的领域。我们当时可能还没有足够的覆盖面,例如Claude Code,或者Anthropic与Cursor类似的合作。所以,推出Anti-gravity 2.0后,我们已经在Google内部使用了一段时间。

我在Google I/O大会上分享了Token的使用情况。我从未在公司内部见过这样的景象,我们的规模每周都在翻倍,大家正真切地将这些模型投入到实际工作中。这正帮助我们不断攀升,进步非常大。虽然前沿领域非常动态,但我非常乐观,并且有信心我们将会在那里取得突破。

Casey Newton:听起来,如果说有哪个领域让你觉得还没有完全达到你真正想领先的地位,那就是编程。是这样吗?这就是你施加压力的地方吗?

Sundar Pichai:我认为编程最终会成为我们所做的一切事情的基础,所以这是一个必须坚守的重要前沿阵地。在编程领域,我们一直表现得非常出色,我们非常擅长创建单次生成的Web前端及相关内容。但就资深开发者在复杂代码库上工作的长期运行任务而言,我们正在取得进展,只是与其他人所处的领先水平之间还存在差距。但我们正在努力,我们对此非常清楚,并且正在这方面取得进展。

Casey Newton:Gemini 3.5 Flash已经发布一天了。我确实认为,通常需要几天时间才能真正对这些模型进行全面的压力测试。不过我们也看到了一些关于定价和模型质量的抱怨。很好奇你对目前为止的市场反响有什么看法。

Sundar Pichai:我期待着能完成采访,这样我就可以花更多时间与团队在一起。这需要一两天时间来适应。这是一个新模型,且处于我们取得了一些进展的新领域。可能会出现一些性能退化,但我认为我们将能够通过训练后处理(post-training)非常迅速地解决。

我们观察到了一些伪影和行为问题,这些都很容易解决,所以我们会处理的。考虑到就在我们发布了大量内容的一天后,我们收紧了使用限制以避免服务中断。但你们很快就会看到我们在放宽使用限制方面取得的进展。当你遇到这种情况时,感到沮丧是理所当然的,我也有同感。但这些是我们将会解决的领域,很快就会取得进展。

Kevin Roose:似乎一些AI公司取得成功的秘诀之一就是专注。Anthropic和OpenAI对编程领域有着一种近乎执着的专注,而OpenAI去年曾因投资过于分散而受到批评,因为他们当时试图同时做太多的事情。现在他们已经收缩并加强了这种专注度。你是否觉得Google在编程领域投入了足够的精力,还是说你正在进行的其他所有尝试,正在分散主要攻势所需的资源、时间和专注力?

Sundar Pichai:我们所有人都看到了在编程领域出现了一个转折点。我们都在对此做出回应,我们在这一领域有着相当严肃的布局,所以我不认为这会是一个问题。我们是一家大公司,拥有规模优势,因此能够同时专注于少数几个不同的领域。我不认为这存在任何根本性问题,只要我们正在取得进展。我认为在这个领域,我们正处于一个30到60天就仿佛跨越了五年的时刻。

2.AI搜索转型与商业模式的未来

Kevin Roose:另一件引起广泛关注的事,是本周你们对Google门户——搜索栏所做的更改,这是25年来最大的变革。我想很多人都预料到,在未来的某个时刻,那种常规的Google经典搜索界面会消失,那10条蓝色链接可能会消失,而你会直接将这种AI模式作为默认选项。但你们目前还没有这样做。虽然有很多集成,但如果用户需要,依然可以看到那10条蓝色链接。你认为这种情况会在某个时刻消失吗?你会像撕掉创可贴一样,直接进入全AI模式吗?

Sundar Pichai:引导用户共同经历这个过程,以及确保产品符合他们的预期,这两点都很重要。所以我尽量不操之过急。非常明确的是,随着我们经历这些变革,人们的反应是积极的。我们可以从产品的长期指标中非常清晰地看到这一点,所以我们理解这一点。

但是,人们希望搜索是快速的,通过搜索与网络上的内容建立联系,这对我们很重要。所以你会看到我们不断有条不紊地改进产品。一年前我们还没有AI模式,但现在很多人都在体验它,我们让进入该模式的过程比以前更加无缝了。这是一个持续的过程,来源和链接将始终作为搜索的一部分存在。

Kevin Roose:Casey在过来的路上告诉我,他觉得自己在过去一年里基本上没有进行过传统的Google搜索,现在完全在进行这种AI搜索。当你听到这些时,你的反应是“太酷了,这就是我现在想要的那种用户”吗?还是你会感到一丝寒意,因为传统的搜索广告业务对你们来说是一门相当不错的生意?

Sundar Pichai:如果说有什么不同的话,在AI模式下,智能体将能为你做比10年前更多的事情。我认为经济价值始终取决于你为用户提供的总价值。我们都会认为,随着时间的推移,我们为用户提供的价值在不断增加,竞争更加激烈,选择也更多了。所以我对订阅和广告相结合的模式感到很放心,正确的商业模式将持续存在。在这个新世界中,亚当·斯密的规律并不会改变。

3.公众对AI的焦虑与社会应对

Kevin Roose:让我们谈谈公众对AI的认知。《纽约时报》和CNN本周进行了一项民意调查,结果发现只有约16%的人认为AI主要是积极的,约35%的人认为它主要是消极的。你如何看待我们目前看到的这种对AI的抵制情绪?你认为Google在改变这种认知方面有多大影响力?

Sundar Pichai:我一直将AI视为人类将要研发的最深奥的技术。它正以非凡的速度向前发展。人类目前的进化程度还不足以应对如此巨大的变革。我认为人们理所当然会对这项技术将带来的未来感到焦虑,我完全能理解。伴随着如此深刻的技术变革,这种反应很自然。

我们曾经历过简单得多的技术变革,那些变革也曾引发过焦虑,而这次的规模与我们以往所见过的任何事物都不同。作为一个行业,我们必须付出更多努力持续推动并展示这项技术所能带来的益处,这是我们可以掌控的事情。我们在扩大基础设施投资规模时还有更多工作要做,以确保这些系统运行得更好。

但我认为人们的担忧比这些更根本,围绕着这一转变的焦虑超出了这些技术范畴。这其中很自然的一部分是人们对在这个世界中的经济前景感到焦虑。很多讨论都指出工作岗位将发生激进的变化,部分岗位会消失。

我倾向于认为未来的前景比那些悲观的预测要好,但作为一个社会听到这些声音,如果人们不感到焦虑,我反而会感到惊讶。变革发生得如此之快,我们需要公民参与进来,意识到这一切正在发生并表达他们的偏好,这正是促成社会行动的原因。所以这种正在进行的对话有其健康的一面。考虑到技术进步的速度,无论是担忧还是我们需要认真对待它的态度,都是完全正确的。

Casey Newton:你下个月要在Stanford发表毕业典礼演讲。最近有很多毕业典礼演讲者因为公众对AI感到担忧而遭到了大学生的嘘声。你打算对毕业生们谈些关于AI的什么内容?你有没有准备好应对嘘声的策略?

Sundar Pichai:每当我们推动技术进步时,它都有助于推动世界的进步。这些毕业生将成为推动这一进程并应对技术影响的重要组成部分,我们必须对此保持高度关注。我一直对下一代人持有极其乐观的态度。尽管我们总是对这个世界感到焦虑并担心下一代,但我相信他们会迎接挑战去建设一个更美好的世界。这与历史上的其他转折时刻没有什么不同,我的目标就是分享我的经验。

Kevin Roose:我很想听听你关于那个观点的更多细节。虽然工作可能会发生很大变化,但对于初入职场的毕业生来说,经济前景依然是光明的。在你心目中那是怎样的一种情况?

Sundar Pichai:从基本层面来看,我们所有人都将拥有一种全新的能力去处理各种事务。当电子表格向大众普及的时候我还没入行,我完全不知道在那之前人们是如何进行财务分析的。电子表格改变了这一切,同样地,AI也将会改变许多人的起点。仅仅在编程方面,快进看我们目前所见的进展,世界上将会有更多的人能够编写代码。听说你们两位可能就是这方面的例子。在这个过程中,我们将以全新的、甚至偶然的方式解决那些曾经被低估的问题。人们将会变得更高效也会有更多闲暇时间,这些都将同时成为现实。

在很多领域,比如医疗行业,医生们的倦怠率非常高。他们的天职本该是花时间照顾病人,但实际上他们花在病人身上的时间比例却少得可怜。AI实际上会帮助他们更多地投入到病患护理中。关于放射科医生的类比一直非常引人入胜,这已经持续了整整十年。我审视自己,这辈子做的扫描检查比我父亲多得多。由于数字化,现在每一次扫描所包含的信息量都是过去的10倍以上。我认为这个数字在未来10年内还将增加10倍。我们需要AI来跟上即将到来的庞大需求。这一切产生的影响将是非线性的。

我绝不想淡化这一点,每一次技术变革都会带来冲击,作为一个社会我们需要极其严肃地对待并参与其中。目前的许多对话理所当然是在思考这个问题。但我确实认为AI有很多积极的维度尚未被充分讨论,同时我也并不完全认同一些过于确定性的悲观预测。

4.AI智能体的应用场景与用户信任建立

Kevin Roose:让我们谈谈智能体(agents),因为这与未来究竟什么会让我们变得更高效以及它将如何改变我们的工作息息相关。今年夏天晚些时候你们将发布Spark,这似乎是一个面向普通人的智能体。能否为我们举例说明一下,这个智能体目前正在为您个人做些什么?

Sundar Pichai:我在职业场景中用得比较多,它主要在我的企业账号中提供。在那个场景下,用它来准备任何会议都超级方便。我刚才就把Hard Fork播客作为一个测试案例。

Kevin Roose:说实话,如果你把它发邮件给我们,我们会把它投在大屏幕上。我们想知道Gemini是如何追踪我们的。

Sundar Pichai:里面有一些关于你们两个人的内容,所以我觉得我不能把它投射出来,半开玩笑吧。最近我的个人账户里也上线了这个功能。我让它查看我接下来的会议并按类别进行颜色编码,以便清楚地了解自己的时间分配。看着它完成这些真的很不可思议,它建议了两种配色方案让我选择,直接更改了日历中的颜色,感觉非常科幻。它将私人会议、健康相关的会议以及工作时间清晰地标记出来。这就是我为了查看进度而进行的个人查询测试。

对于智能体,我们必须给人们一种掌控感。就像让人们放心地坐在自动驾驶汽车的后座上一样,我们需要分步完成。如果智能体发生了意料之外的事情,人们会有所退缩。因此赢得他们的信任、给予他们掌控感和透明度至关重要。更重要的是,从安全角度来看这些系统可能被黑客攻击,所以我们要确保不会以错误的方式超越前沿。

5.算力竞赛、开源策略与AGI安全

Kevin Roose:我想问一个与安全相关的问题。所有顶尖实验室都在竞相实现递归自我改进(recursive self-improvement),即构建能够快速自我提升的AI系统。你认为这能安全地实现吗?你觉得你现在已经能预见到它的实现了吗?

Sundar Pichai:这些模型正在变得越来越擅长编码和智能体(agenting)工作流。你今天可以在Antigravity中看到,在超过12小时的时间里,它可以从零开始构建一个简单的操作系统。这些工作如果让人来做需要耗费数千小时。你现在已经能在工作中看到其中的一些成果,拥有智能体(agents)和子智能体(sub-agents)并对它们进行编排协作,共同构建事物。

这是一个连续的过程,我们肯定都取得了一些进展。但就人们所描述的人工通用智能(AGI)而言,我不认为我们已经达到了那个阶段。AGI将代表下一阶段的加速,这会产生很多影响,但我们还没完全达到那个阶段。

Casey Newton:是否有一个应对计划?比如当我们刚刚达到了自我改进率时,我们要打破常规还是会发生什么?

Sundar Pichai:对于所有负责任的AI应用,如果你正面临那样的时刻就不应该只是内部对话了。这必须是一个更广泛的社会对话。我们都必须在AGI的那些阶段避免竞争风险。

Casey Newton:目前所有的实验室都在竞相获取更多的算力,对算力的需求似乎是无穷无尽的。大家正在竭尽所能地囤积资源、达成交易、建立自己的数据中心。Google仍在向竞争对手和这场竞赛中的其他公司出售TPU的访问权限,为什么?为什么你们不把这些留给你们自己和你们自己的模型呢?

Sundar Pichai:我认为两者之间互不制约。只要我们能制造出足够的芯片,它就不是一个约束因素。我们有Google DeepMind(GDM)和第一方服务,同时也有Google Cloud这项拥有收入和现金流的业务,我们正在为此制定长期计划。如果我们没有云业务,无论如何我们都不会去规划那么庞大的芯片产量。

向他人提供TPU具有诸多优势,Anthropic的研究人员使用TPU这一事实促使我们开发出最好的下一代硬件。我们也使用NVIDIA出色的下一代芯片并开展合作。我这一生一直致力于Chrome、Android或Google Cloud等众多平台的开发。开源某些东西或提供这项技术有其内在价值,这能让我们保持在最前沿,规模经济在各个方面都有所帮助。

Kevin Roose:上一次我们请你来的时候,问过你关于AGI的看法。当时你回答说是否达到AGI并不重要,因为这些系统将会变得非常强大,Google的策略应该保持不变。我注意到你在今年的主题演讲中没有提到AGI,Demis提到了,但你没有。你现在如何看待AGI这个术语,以及所有这些进展都在朝着某个单一的、改变世界的终极目标迈进这一观点?

Sundar Pichai:向AGI迈进是正在发生的必然趋势,我们确实是这么认为的。我早就理解了这一点,否则10年前我就不会将公司转型,把这项技术置于核心地位。我之前的意思只是说,即使AGI需要10年才能实现,这项技术在三年后也将比我们今天所拥有的强大得多。我不希望人们因为认为AGI还需要10年时间,就觉得不需要采取行动或做准备。

Casey Newton:你也是AGI的信徒吗?

Sundar Pichai:我确信这项技术正在朝着AGI取得基础性的进展。我不太能确定地预测这会在三到五年还是五到十年的时间范围内实现。但过去一两年的进展速度让我觉得它比预想的要更近一些。作为一个管理全球最大公司之一并对社会负有责任的人,我对此使用的措辞可能会比其他人更谨慎。但就公司而言,10年前在I/O大会上我就发布了TPU和AI-first数据中心。我们非常清楚这项技术的发展方向。

Kevin Roose:这可能是最后一个问题。今年主题演讲中最令人难忘的短语之一出自Demis之口,他说我们正处于奇点(singularity)的脚下。你能告诉我们,从Google的角度来看这具体意味着什么吗?人们应该对此感到兴奋、恐惧,还是两者兼而有之?

Sundar Pichai:显然我就这个话题与Demis进行过多次交流。我认为他将奇点(singularity)定义为AGI的到来。如果我没记错的话,他曾阐述过到2030年左右实现AGI。如果你相信这一点,那这种表达就是合理的。对他来说,这就是他定义奇点的方式。Demis和我以及我们中的许多人都觉得,如果你坚信这一点,将其明确表达出来就很重要,因为我们都处于构建这项技术的最前沿。希望人们正在倾听,作为一个社会我们需要内化这一点并为此做好准备。

Kevin Roose:Sundar Pichai,非常感谢你的到来。很高兴能与你交谈。

Sundar Pichai:非常感谢。

加载中...