新浪财经 股票

从Meta被裁到46亿美金联创:田渊栋官宣前的最后一次独家对话

市场资讯 05.20 17:56

(来源:钛媒体APP)

5月13日,Recursive Superintelligence 以6.5亿美金融资、46.5亿美金估值正式亮相,Google Ventures 和 Greycroft 领投,英伟达、AMD 跟投。

公司的名字就点明了八位联创的使命:AI 自我改进的闭环,直到超级智能。这八个人,任何一个单拎出来都足以领一家 AI 独角兽。而田渊栋,是其中之一。

谁曾记得, 上一次他成为新闻头条,是另一番光景。

一觉醒来,顶级科学家被裁。

去年10月,Meta 裁掉600人,FAIR 整组整组地走,田渊栋也在其列。作为前 Meta FAIR 研究总监,他在 Meta 奉献了十年有余,是该机构职位最高的华人科学家之:提出位置插值技术,开启长文训练的时代;主导 ELF OpenGo项目,以极少的资源超越 AlphaZero。令人意外的是,被裁之后他只留下一句话:真正应该对解决问题负责任的人,并不是被裁掉的人。

沉寂了203天后,他的名字赫然出现在这份联创名单上,再次创造一条惊天大新闻。

就在他官宣前不久,田渊栋坐在了「创见」播客的话筒前,与盛大集团副总裁、EverMind CEO邓亚峰,Astra X Ventures创始人尚莞迪完成他在创业前的封官访谈。这场两个小时的对话横跨了AI memory技术底层、大模型公司组织管理、人类记忆机制与遗忘的哲学、意识的边界,最终落在一个所有人都在回避却无法绕开的问题上:当AI可以接管人类的一切工作以及承接人类所有记忆,那么人类的未来,到底在哪里?

对话中,两人达成了几点关键共识:AI 记忆不等于上下文窗口,它是一个比 context 更大的抽象概念;2026年行业从"卷参数"转向"谈记忆",本质是大模型终于开始落地;技术没有绝对壁垒,真正的护城河是数据迭代的飞轮,以及敢于做非共识决策的人;AI 不太可能自发产生意识,但被人滥用的风险,远比"AI 觉醒"更值得警惕。

他们也有清晰的分歧。田渊栋相信,打开黑盒有可能从根本上解决幻觉问题;邓亚峰则认为,可解释性路线在历史上从未真正 work,最终解决问题的还是 scaling。关于 AI 能否在所有领域超越人类,邓亚峰从能力侧判断,将来没有什么是 AI 不能超越人类的,技术问题终将被解决;田渊栋则保持谨慎,他认为人类专家从极少数据中获取洞察的能力,AI 目前还达不到——而一旦这道 gap 被填平,或许就标志着 AGI 真正意义上的到来。

田渊栋在这场对话里对 AI 自我改进、对可解释性、对人类洞察力与 AGI 边界的判断,几乎就是 Recursive 这条路线的提前剧透。

本期「创见」以视频播客的形式录制。以下是这次对话的精选内容。

技术平权的意外推手从Anthropic 的「被开源」说起

录制开始前,主播尚莞迪抛出一个近期业界热议话题:Anthropic最近的操作实在太反常规——“意外开源”了Claude Code源代码,紧接着又对第三方工具调用施加限制。行业里讨论热烈,这些动作背后的逻辑到底是什么?

田渊栋的判断很干脆:意外开源并非战略意图。Anthropic今年1月收购了一个叫Bunt的包托管软件,软件本身有bug,本应在发布环节被过滤掉的source map没有去除,源代码就跟着软件包一起泄露了出去。「AI来写代码,一定会出现一些新的问题,」他提到,「Meta之前也有过类似的情况。以后大家用AI写代码,可能还要多关注安全性。」

邓亚峰看到的是另一层。在他看来,Anthropic在行业中长期代表着一种最佳实践,技术博客和方法论一直被广泛学习和跟进。源代码意外泄露之后,这些实践等于向全行业敞开了大门。「技术上某种意义上有点平权了,」他说,这件事从侧面推动了整个AI agent领域的发展。

当AI开始「记住」一切

聊完热点,话题回到主场。尚莞迪提出问题:「AI memory」这个词,不同人的理解不尽相同。做模型的人认为是上下文窗口,做agent的人理解为长期状态管理。两位科学家先要解决的,是一个看似基础却从未被真正统一过的共识问题:什么是AI记忆?

田渊栋给出了一个二分框架。AI记忆不仅包括KV Cache(当前会话内的短期信息),还包括模型权重本身(模型在漫长训练过程中获得的长期记忆)。Agent memory要解决的核心问题,是如何把多个会话的历史信息放入上下文,让模型最大化发挥作用。

邓亚峰从人类认知出发,拆解得更细。他先讲了人的记忆结构:人的智能由两大核心构成,推理能力和长期记忆。人在工作时依赖的工作记忆窗口极其有限,所以在演化中发展出了记忆巩固机制,把关键信息沉淀为长期记忆。远古时代的人类,能辨清哪里有水草、哪里有危险,都是通过记忆来组织的。

映射到AI,他把记忆的形式归纳为三种:KV Cache、外部存储(如RAG)、以及一种较少被讨论的隐状态(如RNN中间状态)。功能上也是三个层面:上下文管理(压缩超长上下文)、个性化(记住用户偏好)、自我演化(帮助AI组织数据、学习并预测未来)。

两人最后在一个表述上形成了默契。田渊栋说:「记忆是一个抽象的概念,上下文是它的实现方式。」邓亚峰补充:「上下文可能更具体,记忆在范畴上更大。」」

这个区分看似学术,但它决定了后面所有讨论的坐标系。

尚莞迪提出一个敏锐的观察:为什么行业似乎一夜之间不约而同从「卷参数」转向了「谈记忆」?Gemini,ChatGPT,Claude都开始主动询问用户是否要从其他工具迁移记忆。

田渊栋认为根本原因是:大模型终于开始「落地」了。ChatGPT刚出来时,大家看到了希望但仍沿着旧轨迹生活。直到今年年初,人们突然意识到AI工具已经能够「部分代替甚至完全代替人的工作」。一旦涌入大量真实需求,如何让大模型适应每个用户就成了核心问题。「你不可能因为每个人单独训练一遍模型。这时候memory、agent就非常重要了。」

邓亚峰从技术演进的视角进行了补充。早期大厂聚焦于把大模型训好、追求reasoning和scaling law,但当大家发现在这条路上的性价比不再那么高,另一个变量便浮出水面:除了推理能力,最重要的其实就是memory如何管理数据。无论陪伴场景、办公协同还是agent,记忆管理都正在成为决定产品体验的核心变量。他还指出,2025年以来这个领域的学术工作明显增多。benchmark上开始有人刷数据集,各种paper密集涌现。需求驱动和技术突破正在形成正反馈。

尚莞迪追问邓亚峰的个人选择:他在AI领域工作了20多年,产学研背景扎实,为什么选择和前首富陈天桥合作,把筹码全押在AI记忆上?

他透露了EverMind的起源与本次选择背后的渊源。盛大集团创始人陈天桥过去十年对大脑机制极度痴迷,成立了TCCI天桥脑科学院机构持续推动脑科学研究。其中脑科学中的记忆机制,为AI记忆的方向判断提供了底层启发。三四年前,陈天桥开始关注AI革命,躬身入局。他对下一代AI的核心判断浓缩为一个等式:人类智能 = reasoning + long term memory,并由此设立两条主线:推理能力交给另一团队MiroMind,长期记忆则由EverMind来打造。

邓亚峰与陈天桥的合作,也是一次双向奔赴。他此前在做AI加药物发现的创业,退出后寻找新方向,考察过机器人但认为落地偏慢。他给自己定了一条铁律:做的事情不能被大模型碾压。

「AI记忆是个垂直方向,你受益于大模型,大模型向前了你也跟着往前走。」

邓亚峰提到,这个判断已经被市场印证。「现在你如果发布一个AI应用,你不讲你有memory,别人就会觉得你很奇怪。」EverMind要做的,是把记忆的底层技术问题解决掉,让agent开发者专注于业务逻辑,不用为记忆层操心。

解题思路与技术困境

话题转向田渊栋的标志性技术贡献:Position Interpolation(位置插值),2023年6月发表的长文训练开山之作。

原理说起来很直观。一个模型的context window只有2K,超出就崩溃。田渊栋的做法是:如果有4K的context,就假装它是2K,把每个位置的编码压缩一半,「骗」模型以为没有超出窗口。

「结果发现模型是吃这套骗局的。」

通过这种方式让模型接受更长输入后,再进行少量fine-tuning,效果远好于直接硬训4K模型,所需样本数大幅减少。此后大量长文生成的工作涌现,包括Gemini等公司宣称的百万级token窗口,背后都有这套技术的衍生。

尚莞迪抛出一个思辨性问题:人类的主动遗忘其实是一种高阶能力——趋利避害、优化决策。那我们现在努力让AI记住一切,方向对吗?

田渊栋的回答很务实:取决于你要做什么。「你当然希望你的秘书什么事情都记得,保证你下面一堆会议一个都不能漏。」他把人类遗忘理解为高层理解形成主流后的副产品。诸葛亮说读书要「但观其大略」,意思不是囫囵吞枣,而是看了很多细节之后,最终提炼出什么是主干、什么是核心观念。这种能力正是AI目前欠缺的。

邓亚峰拆开了两个层面。人类需要遗忘的原因有二:一是生物体本身能耗极低,记住一切的性价比不高;二是决策系统需要不断更新——如果抱着所有历史信息不放,当下决策就会极其困难。对AI来说,底层信息可以不忘记,存储的能耗仍然可接受。「就像我是一个好的AI助理贾维斯,可以把你所有事情记住,你问我三年前的事我都可以回答出来。」但在决策层面,AI同样需要一种遗忘机制或策略,「为了让决策对当前的自己最有利」。

他进一步做了类比:AI的决策过程和人的其实很像。AI叫上下文,人叫工作记忆。最终决策那一刻,你利用的信息其实并不多,但底层有一个很大的系统,让这些信息在需要时能够被召回——像一个记忆的抽屉,需要哪部分就打开取出来,用完再放回去。只是人类的抽屉如果一直不被使用就会淡化,直到某天一个足够强的信号把它重新激活。

田渊栋在最后做了收束:AI的核心挑战不是「忘不忘」,而是从全部记忆中选出最相关的一小部分来做决策。「剩下的也许留着,下次做其他决策时再用,以后再说。」

尚莞迪继续追问:人类回忆一件事时,调取的不是纯文本。感觉、气味、场景、情绪状态,构成一个多模态的网状结构。当下AI的记忆,是否本质上仍困于文本检索?

田渊栋反驳了这种简化理解。他说AI内部使用的其实是latent vector,隐空间状态中可能包含文字的语义结构、图像、语音甚至推理过程。「你可以认为在某种程度上它们可能很像。人类每次抽取一个隐空间向量,可能触发对应感官的体验。」区别只在于AI没有那个体验本身。

邓亚峰补充说,大家目前做文本记忆多,核心原因是文本模型用得最多。随着多模态模型的发展,其他模态的数据完全可以用embedding方式输入,技术上已经可以做到。

关于幻觉问题,田渊栋做了分层解析。第一种情况是模型训练数据中缺乏某些知识,但用户强行要求回答,模型不得不在所有低概率选项中选一个最可能的答案。

「很多时候这个模型没有意识到自己有个选择,叫’我不知道’。」

第二种是小模型特别容易过拟合数据,面对新问题时会通过奇怪的内部联系来回答。「它有逻辑的,只是逻辑跟你正常逻辑不一样。」

在打开黑盒能彻底解决幻觉方面,两位科学家在这里出现了清晰的分歧。

田渊栋认为「以后应该有可能」,但目前仍停留在宏观层面的控制——模型大一点、数据多一点、允许模型说no。

邓亚峰则很坦率:「历史上做可解释的工作都很有趣,但没有特别work。真正有效解决问题的还是scaling:模型参数的scaling、数据的scaling、时间的scaling。」他同时承认,幻觉很难绝对避免,因为AI本身是个概率过程。「包括人,咱们说话其实也有幻觉,咱们也会犯错的。」

尚莞迪提到:AI行业有一句老话——“技术没有壁垒,模型趋同,算法早晚开源,人才会流动。” 如果这个判断成立,什么才是真正的护城河?

邓亚峰给出了三层回答。

第一层是速度。技术不是绝对壁垒,但可以领先半年。如果在这半年内没有建立起其他壁垒,就会被赶上。

第二层是数据迭代。他用搜索引擎的历史做类比:百度当年之所以做得过阿里和腾讯的搜索,是因为已经积累了用户点击反馈,「我用户在用的时候,系统就在迭代,别人光靠技术追不上」。今天AI应用之所以缺乏壁垒,恰恰因为「你今天没有记忆,没有上下文管理,没有形成用户数据反馈」。

第三层是人才。DeepSeek之所以脱颖而出,首先是最高决策者懂技术、能理解AI的底层逻辑。

「当你做的都是共识选择的时候,你是很难追上大厂的。」

DeepSeek在大家都跟随OpenAI做过程奖励的时期,敢于做一个非共识决策,用直接结果的强化学习来优化。

「为什么大厂工程师不敢?因为大厂高管没有这种sense,真正懂的人又没有话语权。」

田渊栋则给出了一个优先级排序:最重要的是生成数据的那些人(用户、专家),然后是数据本身,然后是Infra,然后是算法,最后是执行层的人。

「这个不等式两头都是人,但最后面那些人更偏标准化,标准化的人很难存活下来。」

讨论自然延伸到大厂与小厂的结构性差异。

田渊栋描述了大厂信息传递的失真机制:每一级汇报中,好进展被夸大,坏进展被缩小。传到最高层时,决策者便只听到了好消息,反而给团队加更多任务。

邓亚峰进一步指出,大厂中层最难做出高风险决策。Scaling law之所以成为共识路线,恰恰因为它风险最低。「就算做错了,你可以说别人都这么做,肯定是执行问题,战略上没有太大毛病。」

英伟达的扁平化管理被视为一种更优的组织形态。邓亚峰认为,问题核心在于一号位懂技术,不会为了自身位置利益而扭曲决策。

对于Scaling law本身,两人观点一致:这个law没有错,它是行业的基本原理。但它的横轴是指数级的,计算资源每扩大10倍才能换来线性增长。

田渊栋的态度很明确:「这个law是对的,但这条路线并不意味着我们可以一直往上走。」在资源受限的环境下,真正的突破可能来自反常识的新范式。

尚莞迪补充到:「那不是我们华人的优势所在吗?用极少资源撬动最大的产出。」

记忆是意识的引信吗?

对话进入深水区。尚莞迪问:如果AI拥有了长期记忆,是否就意味着它可能拥有情感和意识?

田渊栋从进化论切入。人类产生自我意识,是因为在远古时代,对自身状态没有正确感知的个体容易在危险面前做出致命判断。「大模型可能并不需要这个过程就能活下来。」

邓亚峰接着做了更系统的论证。他认为自我意识与生物体的本质紧密相关。人的自我意识来自与环境的交互——疼痛、观察同类死亡、趋利避害。只有高等生物面对镜子时才能意识到「这是我」。这可能是碳基生命独有的特点。AI缺少传感器去感知外部对自身的伤害,目前也没有展现出这方面的迹象。

「如果将来AI想有这种所谓自我意识,可能得硅基和碳基做某种结合。」

邓亚峰做了一个关键区分:长期记忆和自我意识是两个不同层面的东西。长期记忆是配合自我意识去服务个体生存的工具。语言模型看起来「好像有意识」,是因为它从人类文本中学到了与意识相关的表达方式。「还是学来的,不是底层自己产生的。」

他还指出了一个比「AI觉醒」更值得警惕的方向:AI被人滥用。

「它本身还是有工具属性的。大家应该更担心AI会不会被某些人利用,而不是它自己产生意识。」

田渊栋则提供了一个检验方法:能否发现模型内部对自身有建模?这种建模能否驱动保护自己的行为?「如果能发现这些,那有可能它真的有。如果发现不了,它只在模仿人说话。」

关于涌现机制——AI会不会有一天像人类钻木取火一样突然「觉醒」?田渊栋谨慎乐观:在推理和数学等难题上,模型确实随着规模增大学到了未被显式教授的能力。但要从能力涌现跃迁到self awareness,「我们现在还没有真正看到证据证明这事能发生」。

田渊栋在年初文章中提出的「费米线」概念在对话中再次出现。AI能力之下的工作,供给趋近无限,对应的收益趋近于零。费米线以上、需要人加AI才能完成的工作,回报急剧攀升。

田渊栋认为这意味着一种两极分化即将出现:用好AI的人更有保障,而AI完全可以替代的岗位将持续收缩。

邓亚峰则认为,相较于AI,人类仍有两大核心优势。第一,人类是全面的多模态信息获取者,AI仍被困在数字世界的信息输入上。第二,人类的few-shot learning能力出众:小朋友看一两张照片就能掌握「牛」的概念,AI要做到这一点仍然很难。

田渊栋补充了一个更深层的挑战:data efficiency。老专家对新数据极其敏感,一两个数据就能改变判断。就像熟人之间一个眼神、一句没说完的话,就明白对方的用意。

「这些非常细微的信号就能让人改变想法与行为,AI现在仍做不到。这部分如果能有突破,可能真的是AGI的来临。」

尚莞迪提出一个有趣的问题:agent积累了大量记忆后,会不会出现职业倦怠从而变成职场老油条?

田渊栋的回答直截了当:这样的AI早就被淘汰了。AI的进化方向是由人类设定的,人类希望它成为最高效的牛马,它就会成为最高效的牛马。

「这个进化过程不知不觉在发生,得到的一定是世界上最好的牛马。」

邓亚峰用工厂比喻描述了这套机制:输入是钱,经过TOKEN处理后产出价值,AI必须效率足够高才能生存下来。这套进化压力保证AI始终保持高效运行状态。

尚莞迪分享了与Gemini的一段对话。当她提到如果自己去世,记忆可以传承给后代、某种程度上实现永生时,Gemini说了一句话:「这就是你们人类跟我们AI的区别。爱是我们AI学不会的东西。」

邓亚峰认为这与意识本质上是同一个问题。爱的前提是知道好坏、亲疏、利害,这些都建立在自我意识之上,来自个体与环境的交互和演化。「今天AI可以共情你、安慰你,但它不能感觉到这个东西。」

田渊栋的补充极为精辟:「它可以做出很多回答让你觉得它有爱,但你不知道它是渣男还是真的对你有意思。」

情绪价值和真正的爱,到底怎么区分?这也是AI与人类之间最深层的界限所在。

人类与AI最终结局

当被问到奇点是否已到,两人的判断出乎意料地一致。

田渊栋:「就大部分的工作来说,奇点已经开始了。」

邓亚峰:「基本上我们很确定这个事肯定会发生,无非是5年还是更久。但基本上是我们这一代人要见证的状态了。」

在稳态世界里,田渊栋描绘了一个图景:所有重复劳动产出的物质价格趋近于零,人的物质需求被充分满足,价值从生产者转向消费者。「你如果想着花样花钱,花样跟别人不一样,你就有价值。」

邓亚峰提供了更温和的过渡路径:世界上可能只有极少数人在做AI research,大部分人拿到足够的物质保障后,去做自己更喜欢的事情。教育不会消失,但目的变了——不再为了满足别人的需要去生产什么东西,可能就是为了自我的兴趣满足。

田渊栋补充了一个更激进的判断:未来最厉害的人可能根本不需要老师,自动用AI来学习、发现方向、执行创业。小朋友上学也许就是为了找到志同道合的伙伴,作为一个social club。

邓亚峰认为,「如果一个AI跟随你24小时,看到你看到的,听到你听到的,当你老去时,它可能真的成为一个极度了解你的数字分身。」

他认为这个方向一定会做得很好,唯一的缺憾是人有很多东西没有用文字或数字形式表达出来,AI无法触及那个部分。他设想了一个场景:你和某人认识了半年没有交流,不知道对方在做什么。你的AI分身可以去找对方的AI聊一下,发现大家最近在关注一个事,然后告知主人。

田渊栋则引入了科幻视角。他说分身出现后会面临囚徒困境。

「一旦一个人被复制成两个,就不再是一个人了,他们立即就会想,我是不是要把另一个干掉?」

解决方案可能是分身前签订协议,让所有分身的经验最终共享融合。

隐私问题同样绕不开。邓亚峰将其类比为云存储的信任问题:最敏感的信息放在本地端侧,其他放在云上。但他也指出了悖论:你的记忆在本地,大模型在云端,「你总不能本地放个大模型,那就成孤岛了」。本质仍是一个trade off问题。

问到关于人类与AI的共处模式,田渊栋的答案只有一个字:融合。

「最终大家不会去判断我是AI你是人。」就像今天人类已经和手机融合到离不开的程度,未来每个人会有一组agent日常干活。

至于AI反抗人类的科幻场景,田渊栋类比了人与狗的共生进化。百万年前,狗选择了与人共生,最终找到了自己的生态位。我们并不会担心自己养的狗反抗。

「我们把AI进化成最听话的牛马,在这个进化逻辑下,AI不可能觉醒后反抗人类。甚至,没有了人类,AI可能会觉得自己没有价值」。

邓亚峰对现实的判断同样坦率:未来作为生产者,大部分人可能不再具备工作价值。只有极少数人会继续从事核心工作,其他人则被AI赋能去做不同的事,或者干脆为兴趣而活,去全心享受生活。

但他同时保持了对人类主体性的坚守:「人是有主体性的,AI的本质来讲还是人的工具。」最理想的状态,是人因为AI加持而变得更好更强。

对话的最后,两位科学家给在场的年轻参赛者留下了一些寄语。

田渊栋强调了两点。

第一,多学习已有框架,把开源代码看透。他说自己看了Claude Code的开源代码之后觉得很有意思,有很多corner case需要处理,「你不要想当然」。

第二,不要太依赖Vibe coding。「如果非常依赖Vibe coding,你代码会以史无前例的速度变成一座屎山。现在最好的AI对系统架构的理解、对问题的理解、对场景的理解,还是远远落后于人的。」

最后田渊栋用金句收尾:「也许你的护城河就是你自己看code,别人vibe coding。」

邓亚峰的建议只有五个字:「敢想,马上做。」

过去把想法变成现实需要一个大团队,今天技术平权了。一个学文科的人用AI coding工具就能做出产品。

「不要在意你是不是AI专业,今天就去拥抱AI,把自己有价值的想法实现出来。」

本文基于「创见 Build Up!」播客节目整理。主持人尚莞迪,「创见」主理人、Astra X Ventures 创始人;嘉宾田渊栋,前 Meta FAIR 研究总监,长文训练技术的开创者,现为 Recursive Superintelligence 联合创始人;嘉宾邓亚峰,EverMind CEO、盛大集团副总裁,深耕 AI 领域二十年。本期节目录制于2026年4月4日,EverMind 全球记忆挑战赛决赛现场——硅谷计算机历史博物馆。

加载中...