新浪科技

UiPath创始人访谈:智能体 v.s. RPA|Bolt荐阅

线性资本

关注

预测 2025 年 AI 的发展重点,很多人都会提到智能体,也有不少人关心智能体和 RPA(机器人自动化)之间的关系。最近,RPA 解决方案提供商 UiPath 的创始人兼 CEO Daniel Dines 在播客节目《20VC》中分享他对这个话题的见解。UiPath 成立于 2005 年,在刚成立时没有融资,年收入仅为 50 万美元。随着找到产品与市场的契合,UiPath 获得红杉资本、Accel、Kleiner Perkins 等投资机构的投资,后于 2021 年 4 月上市,目前市值超过 70 亿美元,是 RPA 领域的知名企业。

在播客访谈中,Daniel Dines 强调做 AI 产品关键在于实用性,而不是单纯追求技术突破。他也介绍了 UiPath 通过将 RPA 与 AI 代理融合,简化低技能与高技能的自动化,并认为可靠的工作流程和人类监督将是企业采用 AI 的关键。我们整理和翻译了采访中的部分内容,原播客内容可以点击「阅读原文」链接跳转收听。

🔍 内容摘要

1. 产品优先策略AI 技术的成功关键在于开发实用性强的产品,而非单纯追求技术的先进性。

2. 从 RPA 到智能体的转型:UiPath 通过引入智能体编排和现代技术框架,从传统 RPA 向智能体自动化转型。

3. 智能体技术应用:智能体技术可用于规则与非规则流程的自动化,并与企业工作流深度结合。

4. 生成式AI的企业价值:生成式 AI 将在规则验证和企业应用中实现突破,为未来自动化奠定基础。

5. 多技术融合趋势:AI 的未来发展将依赖多模型、多技术的结合,适应企业和个人多样化需求。

图|播客 Shownotes

AI 系统的演变

1) Harry Stebbings:你能解释一下,为什么在当前的 AI 周期中“产品比创新更重要”吗?

Daniel Dines:最近我一直在思考我们在 AI 叙事中的定位,以及我们真正能带来的价值。在过去两年里,我们投入了大量时间优化 LLM(大语言模型),并围绕它们构建产品,这也带来了一定的成功。

有一些优秀产品给了我很大的启发,比如 Cursor AI。这款产品基于多个 LLM 构建。这让我回想我们在 UiPath 的初创阶段,也曾借助 AI 开发,使用了一个名为 OpenCV 的开源计算机视觉库,它可以在大图像中识别并定位小图像,我们利用它实现了自动化。比如,当用户需要点击某个按钮时,我们会截取该按钮的图像,并在回放时通过调用函数定位它的坐标,然后完成点击操作。

我回想起来,UniPath 为用户创造了一种直观的操作体验:只需录制屏幕上的操作流程,就能生成相应的指令。用户点击屏幕上的按钮,所有相关数据都会被捕获并存储。例如,用户在编辑框中输入内容时,我们会记录编辑框的图像和标签,以便在运行时准确定位这些元素。

从用户角度看,这个流程非常简单。我在 2013 年向几位 Blue Prism(企业级流程自动化平台,广泛用于机器人流程自动化)的专家们展示了这款产品。相比之下,在 Blue Prism 上实现同样功能需要两天时间,且结果并不理想。而使用我们的产品,仅需三到五分钟就能完成整个流程,并且运行效果完美。当我问他们的感受时,现场一片寂静,大家都难以置信。这成为我们切入市场的起点,许多客户因此选择了我们。从那时起,我们逐步拓展产品功能,最终发展到今天的规模。

2) Harry Stebbings:你认为未来会是由多个专注于不同领域的大模型组成的世界,还是会像今天的云计算市场(由 AWS、Azure、Google Cloud 主导)那样,被一两个模型巨头垄断?

Daniel Dines:我不认为大模型的发展会像云计算那样被少数巨头主导。我更倾向于相信未来会有多个大模型共存。即使从人类大脑的发展来看,也能看到类似的模式。我们的大脑中存在通用认知模型,但在某些特定任务上,专用模型的表现明显优于通用模型。比如一个简单的动作——拿起杯子喝水,这是我们从小就训练的专用模型,它比依赖通用模型更加高效。

未来确实会有一些前沿模型引领方向,但同时也会有大量针对特定任务的专用模型存在。这些专用模型更可能基于开源模型构建,而非依赖闭源的前沿模型。

3) Harry Stebbings:你提到 Cursor 的成功得益于其产品优先的策略,而非单纯依赖技术进步。这种理念对 UiPath 的未来发展方向有什么影响?

Daniel Dines:这对我们的影响非常深远。我们已经在公司内部进行了重大调整,重新思考软件的构建方式。追求渐进式改进、用 AI 做加法是不够的。Cursor 是完全 AI 优先,从零做起的产品。我们要学习这种思路。所以我们现在智能体相关的 AI 产品策略就是从零开始。

为此,我们放弃了一些传统的 RPA(机器人流程自动化)技术,转向全新的技术框架,从头开始构建。这是因为我们希望为用户打造一种完全以 AI 为核心的全新体验。

4) Harry Stebbings:在 RPA(机器人流程自动化)方面,你们具体放弃了哪些技术?

Daniel Dines:举个例子,我们曾经使用类似 Windows 工作流引擎的系统,多年来不断进行优化。但现在,我们切换到了更现代的技术,并以此为基础进行开发。

其实我曾一直对这种改变有抵触,UiPath 的工程师们也就是否引入新的工作流引擎展开了无数次讨论。最终,AI 技术让我坚定了转型的决心——采用专为“智能体编排”(通过协调和管理不同类型的智能体,以自动化复杂的企业流程和任务)设计的新工作流引擎。这种引擎特别适合高效连接智能体、人类用户、其他机器人、专用模型,以及 API 或其他入口点。

Part.02

智能体与企业工作流的整合

5) Harry Stebbings:对 RPA 如何与未来的智能体编排、企业中智能体的使用兼容适配问题,很多人持质疑态度。你为什么认为这种看法是错误的?

Daniel Dines:这是因为很少有人真正理解 RPA 的核心应用场景,以及为什么智能体无法替代这些场景。

RPA 的核心价值在于将企业内多个业务系统中复杂的、基于规则的任务自动化。这些任务通常包括多个步骤,有时甚至多达 100 到 200 步。关键在于,所有任务步骤都遵循明确的规则,输入数据是结构化的。这些规则实际上承载了企业的知识,例如某些增值税号的特殊处理方式等。这种规则化的自动化非常可靠,只要底层系统不发生变化,就能稳定运行。

智能体技术则不同。在自动化场景中,LLM 更适合处理非结构化数据的任务。对于那些无法完全用规则表达的企业知识,智能体可以模拟用户操作,减少人工输入,但无法完全替代规则自动化。因为智能体的核心是自主完成任务,而基于规则的自动化依赖的是清晰的规则逻辑,两者是互补关系,而非替代关系。

6) Harry Stebbings:如果简单用规则化和非规则化来区分,是否意味着客户需要分别从不同供应商购买解决方案?为什么不直接专注在非规则化的部分?或者,为什么非规则化的解决方案不能覆盖规则化的场景?

Daniel Dines:这正是我们进入 AI 智能体领域的原因。这两种部分通常是共存于同一个业务流程中的。例如,从订单到收款或从采购到支付的长流程中,既包含明确的规则化的部分,也有不确定的部分。因此,将两者整合到一个统一的技术框架中是非常合理的。

这也是智能体编排如此重要的原因。我们有能力连接流程中的所有部分,同时自动化这些步骤。打个比方,但它们都可以在同一个平台上协作。正如企业不会为不同员工制定完全独立的工作方式,技术也应该追求统一和整合。

7) Harry Stebbings:你们希望 UniPath 成为一个同时管理低技能和高技能任务的平台吗?

Daniel Dines:我们已经是管理低技能任务的平台,现在正在扩展到高技能任务的管理。但仅仅具备自动化单一任务的能力是不够的。你需要同时自动化数千个任务,并具备管理、交付、部署、监控、数据分析,以及访问控制的能力。例如,谁可以运行智能体或访问特定应用程序。我们已经在 UiPath 平台中构建了这些能力,其中一项核心差异化能力就是对机器人操作的高效协调。

8) Harry Stebbings:但你们真的能做到吗?毕竟你们之前的设计是规则化的,而现在进入了一个非规则化的、模糊的领域。

Daniel Dines:这并不是完全不同的领域。RPA 和智能体的共同点是都在模仿人类操作。非规则化流程更具挑战性,因为它们更加脆弱,必须设置大量异常处理机制和多次重试能力。例如,加载一个网站时响应时间可能波动,因此需要构建足够的技术可靠性来应对这些变化。

我们在机器人自动化方面积累了丰富经验,现在正将这些经验应用到智能体上。构建一个智能体并不难,难点在于让它数千次运行仍然可靠,并且能够作为企业工作流的一部分正常调用。否则,企业不会将其用于生产中的自主任务。

我们的客户普遍反映,他们宁愿工作流任务失败,也不希望它变得过于“智能”,因为他们对任务失败的风险承受度非常低。这种心态同样决定了智能体的应用方式:智能体主要提供建议,而不是直接采取行动。通常流程是智能体先提出建议,由人类用户验证后再触发下一步行动。这是一种逐步递进的模式。

生成式 AI 的现状与未来发展

9) Harry Stebbings:为什么过去几年生成式 AI 在企业中未能成功,而在未来几年会成功?

Daniel Dines:过去生成式 AI 不成功的原因在于其结果不可预测。未来它会成功,是因为我们将它嵌入智能体工作流中,并通过规则限制其不可预测性,同时引入“人类验证”来确保结果可靠。这与传统的聊天机器人完全不同。

在新模式下,企业工作流引导整个过程。例如,客户通过邮件发送房贷申请,这会触发工作流调用智能体处理申请。智能体生成建议并推送到我的收件箱,我可以验证后选择“同意”或“不同意”,从而触发下一步操作,例如调用机器人完成银行系统中的贷款审批。

这种模式本质上是企业工作流驱动,与传统的聊天机器人截然不同,后者缺乏规则和验证环节的引导。

10) Harry Stebbings:智能体构建工具的普及,结合各种技术,是否意味着 UiPath 可以进入新的市场?你们目前主要面向企业客户,未来是否可能拓展至小型企业市场?

Daniel Dines:对此我并不确定。关键在于,构建智能体需要高度专业的技能。虽然技术上可行,但要让智能体真正有效运作,需要经验丰富的专业人才。目前,编写提示的难度甚至高于编写脚本。脚本的行为是可预测的,只需基于逻辑和算法实现需求,而提示的微小变化可能导致完全不同的结果。

我们正在投入大量资源和精力,帮助自动化开发者更好地编写提示,例如提供提示建议、协助构建评估集等。测试脚本是否按预期工作相对简单,而测试提示则复杂得多,因为输入数据的差异可能导致结果出现巨大偏差。

11. Harry Stebbings:Sam Altman 预测我们将在 2025 年见证 AGI 的到来。当然这也不一定,你怎么看?

Daniel Dines:我对 AGI 的定义与他们不同。对企业而言,AGI 的标准是拥有一个 LLM,其能力相当于 IQ 约 120 的人类,同时具备高度可预测性,而不是在复杂数学任务中表现出 180 的 IQ,却在其他任务中仅有 60。这种一致性是 AGI 的关键。

如果实现这一点,整个就业市场和行业将发生深刻变革。但要达到这一目标,我认为需要新的重大技术突破。目前的 LLM 并未展现出我所期待的推理能力。本质上,它仍是一个随机引擎(处理随机变量或概率问题的算法或系统)。

为什么呢?在某些任务上,我远不如 LLM,但在其他方面,我明显优于它。LLM 会犯一些我永远不会犯的逻辑错误,同时又能解决我完全无解的数学难题。这表明其智能本质与人类不同,这种智能类型还无法在对可靠性要求高的商业环境胜任。

加载中...