理解李彦宏：为何AI需要超级有用？

降噪NoNoise

2024.11.1418:17

关注

文｜戴菁

一年一度的百度世界大会，已经成为观察百度AI战略动向以及行业趋势的一个窗口。

在2024百度世界大会上，李彦宏看起来比去年更为笃定。他说，基础模型能力就绪，我们即将迎来AI应用的群星闪耀时刻。

当2023年下半年大模型混战逐渐出现分野，李彦宏就提出「卷模型不如卷应用」。但从随后的行业发展动态来看，国内应用之「卷」集中在了类ChatGPT的AI助手层面，其他领域出现颠覆式创新的AI应用凤毛麟角。

其中一个原因，创新是有认知门槛的，开发AI应用也是有技术门槛的。

或许是意识到了这一点，李彦宏和百度今年进一步向大模型战略聚焦，押注智能体的爆发。

如果现在要问百度的第一性原理是什么，答案越来越清晰——应用驱动。李彦宏还给这个「应用驱动」加了一个有别于移动互联网时代的注解，「不是要推出一个‘超级应用’，而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。」

「做工程不丢人」

过去24个月，万众期待的AI超级应用还是没有踪影。一些人不禁怀疑：全球性的大模型狂热究竟是一场新的技术革命，还是新一轮泡沫？

但如果默念茨维格在《人类群星闪耀时》中所写的：「那些历史的尖峰时刻都需要太长的酝酿时间，每一桩影响深远的事件都需要一个发展的过程」，旁观者或许会更笃定一些。

作为这股AI浪潮最早和最深的参与者，李彦宏提前看到那个「尖峰时刻」。他对AI应用即将爆发的判断，主要依据有两个：

其一，底层技术突破。过去24个月，AI行业最大的变化是大模型基本消除了幻觉，回答问题的准确性大幅提升。基于检索增强技术的进展，百度年初切入iRAG（image based RAG）——即检索增强的文生图技术，进一步让文生图也能消除幻觉，从而让AI在影视、漫画、连续画本、海报制作等领域落地。

▲根据「爱因斯坦在天坛」提示词生成的图片

左为文心iRAG作品右四均为其他大模型生成作品

其二，大模型调用量爆发，开发者觉醒。今年5月，文心大模型API日调用量达到2亿。当时百度高管们在会上讨论一个问题，大模型怎么就算「成了」？李彦宏给出的量化指标是，日均API调用量一年内涨10倍。这说明大家是真需要。到11月初，文心大模型的API日调用量超过15亿，比预期发展快了不少。

还有一个现实原因是李彦宏会上并未展开的——调用成本。过去两年内，大模型每个Token的使用成本下降了超过 99%。以美国为例，现在大模型处理100万个Token的成本仅为60美分。在国内，百度的一些模型甚至免费提供。

从会上传递的信息来看，百度目前重点押注两大应用方向：面向to C端的智能体，以及面对to B端的产业应用。

据我们观察，在to C端，大模型技术应用的广度可能比技术乐观派的预期还要高，因为许多使用场景并不局限于App等传统产品形态。

比如我的一名律师朋友，有时会让AI帮着做一个简单的法律协议，他自己改改就能交给客户。如果是其本人拟这份协议，最起码要用半小时。完成这一交互，他甚至不用专门下载AI工具类App，只通过一个法律行业公众号就能轻松获取。

可以说，AI应用场景无处不在，但产品形态未必跟从前一样。去年在大模型爆发之初，人们就憧憬着AI的iPhone时刻将在大模型领域复刻，诸如移动互联网时代的《愤怒的小鸟》、Instagram等超级应用，也会很快在大模型领域出现。

一年后，超级AI原生应用还没有出现，但新的共识逐渐形成：智能体将会成为AI应用的主流形态——

数月前，OpenAI发文称，在谷歌、苹果等科技巨头的带动下，2025年将是AI Agent最终成为主流的一年。在百度世界大会上，李彦宏再次给出智能体的判断：智能体是大模型最重要的发展方向，即将迎来它的爆发点。

按照AGI的进化顺序框架，智能体被视为Copilot的下一个阶段，它们具备一定自主性，能够执行长期任务，比如与环境进行多次交互、协同工作等，并且拥有自我进化能力。

目前全球很多顶尖科技公司都在关注智能体，但李彦宏在会上透露，百度已经把智能体作为大模型的最重要战略方向。

理由就在于，智能体的门槛足够低，天花板又足够高。去年行业已经意识到应该卷应用，但具体怎么做、怎么从模型变成应用，这里面有太多不确定性，也让很多人望而却步。从移动互联网时代的产品形态变化来看，每一次降低产品门槛，都会带来一个应用范式的爆发。最典型的是从App到小程序的迁移，微信生态从中受益匪浅。

智能体也有相似之处。当平台为开发者提供了一个高效、简单的路径，在大模型上构建智能体越来越方便，「势」就会汇聚起来。像文心智能体平台上，目前已吸引了15万家企业和80万名开发者，每周都有上万个新的智能体被创造出来，其中还有11岁小学生创造的智能体，然后通过搜索和其他渠道分发出去。

不过从李彦宏的发言来看，百度不是要推出一个超级应用，而是要帮助更多人、更多企业打造数以百万「超级有用」的应用。

言外之意，百度在AI时代的生态护城河宽度，未来要靠这些应用来构建了。

由此就不难理解，为什么AI领军人物中没有比李彦宏更着力于应用落地的人了。百度的AI优势，更多体现在底层技术和模型层。而技术的成功与否，最终取决于它在真实生活中的应用。就像DeepMind 创始人、微软AI CEO苏莱曼在最近的一次交流中所强调的，一个没有明确用途的AI模型，不过是一个引人入胜的计算机科学展示。

「自由画布」式的智能体

开始涌现

智能体的爆发离不开「有用」。

李彦宏此前提醒，要避免掉入「超级应用」的陷阱。在AI时代，「超级能干」的应用恐怕比只看DAU的「超级应用」更重要。

结合国内主要智能体平台上的案例来看，目前公司类智能体、角色智能体、工具类智能体、行业智能体是几个主要发展方向。

这其中，公司类智能体被认为是于AI时代的公司官网。结合百度的搜索引擎底色，我们认为，这一类智能体是百度搜索的增量机会所在，公司类智能体是百度升级与KA客户关系、提供更多价值的一个触点。

据百度官方数据，比亚迪的官方智能体上线后，销售线索转化率提升了119%。

不过在整场世界大会中，参会者最感兴趣、最能让人眼前一亮的当属工具类智能体「自由画布」。这个由百度文库和百度网盘联合发布的AI创作新物种，在面向公众开启邀测首日，已吸引超20万人排队预约。

根据现场演示，「自由画布」就是一个由文心多模态大模型加持的万能白板，是百度文库、百度网盘行业首创的内容操作系统。

通过大模型技术，「画布」打通了公域与个人授权的私域内容，通过「一拖一圈」的极简操作，实现对多格式、全模态文件的混合理解、生成、创作，并支持对富媒体文档的一键分享和存储，实现了输入、编辑、创作、分享自由。

今年9月，百度集团宣布，网盘C端业务重新划归移动生态事业群组（MEG），并由百度副总裁、文库事业部负责人王颖接管。如果当时不少人还对这一决策逻辑感到不解。如今「画布」揭幕，通过AI能力进一步打通和重构，文库和网盘已经成为全新的智能生产力。

在上述四类智能体中，从商业化角度，《降噪NoNoise》同样关注行业智能体的前景。仅以保险行业为例，此前有专注大模型to B方向的AI创业者告诉我们，在这个30万亿规模的市场，部分保险经纪人的佣金能占到客户投保金额的20%-40%。如果大模型将保险专业知识沉淀为AI产品，继而能在一些简单险种上为客户制定投保方案，会非常有前景。

比如号称「免费AI律师」的法律智能体「法行宝」，上线半年已经回答超1660万个法律问题。产品信息显示，该智能体由百度自己下场创造的，主界面提供对话交互以及法律计算器、智能法律文书、在线法律意见书等免费工具，还有相似判决案例链接可以查阅。

比如用户可以就一起交通事故、一次工伤，询问赔偿方案、如何计算索赔金额，也可以请智能体代写一份起诉书。以往有这些法律咨询方面的需求时，普通人要么付费求助于专业律师，要么自己在繁杂的互联网中搜索，但要同时承担信息不全或者不准确的风险。

当然也有律师指出，基于专业知识积累和个人经验而提出的法律策略、分析判断等专业法律服务，是AI目前还很难做到的地方。

换个角度想，这或许正是智能体未来的想象空间，因为智能体本身是一个有自主性、会持续学习和进化的产品形态。

不过有必要指出的是，并非基础设施齐备了，就会出现智能体的涌现。一个应用方向的爆发，离不开清晰的商业化刺激。2012年，当《愤怒的小鸟》登陆iOS平台并且大获成功后，通过iOS端的下载付费和安卓端的广告植入，其背后的游戏开发公司当年收入较上一年增长101%，达到1.5亿欧元。

关于这一点，OpenA联合创始人山姆·奥特曼也有预警。在最近一次专访中，他不忘提醒创业者：通过更快地拥抱新技术，你可能会获得短期的爆发式增长，但长期来看，你仍然需要构建一个能持续提供价值的产品或服务。「每个人现在都能做出非常棒的演示，但要真正构建一个成功的商业，那才是关键所在。那是最艰难的部分，而商业规则仍然适用。」

据我们了解，目前文心智能体平台已经逐步跑通商业闭环，实现智能体从开发，到分发，再到变现。单个智能体的单次转化最高收入达到了10万元，其背后是链接挂载、商品转化、线索转化、联盟广告和胶囊位等商业组件的全方位支持。

长期主义、理想主义、现实主义

缺一不可

中美AI巨头经常被拿来对比。相比美国AI同行对于AGI的宏大愿景、以科学研究和底层突破为驱动的做法，从世界大会上的表态来看，百度是典型的工程思路、应用驱动。

会后接受《甲子光年》专访时，李彦宏直言，「做工程不丢人。做工程很有可能是比科学更早发现机会、发现规律的。」就像飞机是先飞上天了，人们才开始研究，原来有一个东西叫空气动力学。所以百度的AI路线是优先解决大家在场景和应用中遇到最多的技术问题。

乍看上去，这与李彦宏的社会标签有一定反差。百度10年1700亿研发投入的故事已经为公众所熟知，李彦宏的「长期主义」、「未来主义」标签也早已得到业内认可。

比如去年9月，李彦宏同马斯克、黄仁勋、奥特曼一起入选《时代》周刊全球AI领袖时，《时代》的评语就是，「李彦宏是中国最杰出的未来主义者，长期投身于AI发展的浪潮。」在近期沙利文发布的《2024年全球AI生态全景概览》报告中，百度被列入AI-Native Giant，与谷歌、OpenAI位于同一象限。

未来主义少不了理想色彩，但应用驱动的策略看起来又很现实。

看似矛盾的地方，或许取决于参与者如何看待人工智能革命的本质。如果AI会带来一次新的工业革命，那这场变革不是三五年就能结束的，可能会在未来几十年持续向社会的方方面面去渗透。作为置身其内的变革参与者，既需要耐心，也少不了源源不断的、真金白银的投入，然后以商业上的成功、生态上的高墙，保持在全球竞争中的头部位置。

正如李彦宏在此前受访时所预判的：未来两到三年，AI竞争会非常激烈，「至于说谁会是最后的赢家，我的看法是谁赚钱谁就能活下来。」

这或许是李彦宏不厌其烦的布道、呼吁大家做智能体、把AI用起来的一个初衷；也是百度一边自己下场做「自由画布」「法行宝」等智能体应用，一边做工具、做基础平台，不断去降低开发者应用开发门槛的动机。

比如世界大会上的另一个重磅发布——无代码开发工具「秒哒」，这个被李彦宏称为「迄今为止人类历史上最复杂的多智能体协作工具」，为的就是让每个人都具备程序员的能力，会说话就能做出应用。此前在设计领域，海外的Cursor和Replit等产品已经实现在不敲代码的情况下，只靠用户的自然语言指令就能生成应用界面。

▲百度发布的无代码工具「秒哒」，只要用中文描述需求，并补充一份带有大会时间地点主题的文档，就可以指挥多个智能体协作，完成报名系统的开发。

这类工具又个共通的底层逻辑——让普通人靠创意就能赚钱。如果类似想法能够落地，AI应用无疑距离大规模爆发更近一步。我们也注意到，尽管「秒哒」明年一季度才会上线，据悉已经吸引超过5000家企业排队测试。

沿着前面的思路，同样可以理解百度为什么没在OpenAI的Sora惊艳出场后，投入到中国版Sora的竞争当中。在李彦宏看来，Sora和多模态是两回事。Sora本质上是任意场景下的视频生成能力，这件事非常有意义，但真正做到需要长期烧钱。

但这并不意味着百度不做多模态，「我们非常非常看好多模态，也在多模态上有非常长期的投入，在真正有应用场景的地方，我们的多模态能力是非常强的。」百度只是选择更落地的方向推进。比如「自由画布」，便是多模态AI功能all in one的平台。

李彦宏在大会当日的专访尾声被问及有何寄语，他谈到，人工智能的革命不是三五年就结束，它更像是三五十年对于社会的全方位重构。需要长期主义、理想主义和现实主义三者相结合。

对于百度来说，未来与现实，或许正是AI战略的一体两面。

参考资料：

[1]《对话李彦宏：应用驱动是百度的第一性原理，基础模型两年一个大版本就够了》，甲子光年