用人工智能改变现有化学材料的产业格局|线性被投企业访谈系列之「深度原理科技」
线性资本
今天,专注人工智能驱动化学领域科学研究的「深度原理科技」宣布完成近千万美元种子轮融资,线性资本领投,真知创投和 Taihill Venture 跟投,晶泰科技与深势科技作为科技产业方参与。「深度原理科技」创办于 2024 年,公司创始成员均毕业于麻省理工学院(MIT),公司的愿景是将人工智能、量子化学和高通量实验技术应用于化学材料领域,让材料创新的工作流程得以改善,加速化学材料研发创新的效率。最近线性资本投资总监周天意访谈深度原理科技联合创始人贾皓钧和段辰儒,深入讨论创业经过和对行业的思考。
周天意:请先简单介绍「深度原理」。
贾皓钧:我们公司叫深度原理科技(Deep Principle),寓意着结合深度学习 Deep Learning 和第一性原理思考 First Principle,也意味着致力于用 AI 来重新解构分子世界的运行原则和运行规律。
具体业务方面,我们作为一家 AI for Science 的初创企业,致力于通过AI来优化和革新化学材料,以显著提高能源转化效率,推动新的生产力的爆发。
做这件事的渊源,和我们的经历和成长经验高度相关。我的合伙人段辰儒算是 AI for Science 领域最早的一批博士。关于创业的想法,我比辰儒稍早一点,大约在两年前做 AI for Science 相关的创业,这也是我从本科到博士期间的研究方向。发现短短几年内,在各种 AI 模型出现之后,运算速度和准确性得到了大幅度提升,之前的计算成本更多和时间因素相关,但现在可能原本需要几个月的计算,几秒内就完成。在这样的情况下,量变引起了质变,我认为未来工业中的材料发现中AI和计算驱动会逐渐取代实验上的 trial and error,同时会有更多的人使用 AI 和计算来发现材料,最后再去做 wet lab 验证,这样会大规模提高整体材料化学的研发效率。
段辰儒:我之前参与了一些 AI for Science 社群组织活动和一些机器学习的会议,深深地感到 AI for Science 整个领域的飞速发展。最直观的一个信号就是参会人数,2021 年我们在 NeurIPS(全称神经信息处理系统大会,是一个关于机器学习和计算神经科学的国际会议)的 workshop 大约有 150 人参加,2022 年是 500 人,到 2023 年 12 月底,有超过上千人参加。AI for Science 社区发展带来了很多新鲜血液,有更多做科研的同学加入,让我们的视角不再只停留在计算机科学(CS, Computer Science),也更加从科研的角度,将AI为一个工具来解决问题。不过我们也有很明显的感受,即科研与工业界的实际应用场景还有很长的距离。
前两年我在微软工作,工作内容包括将化学计算,也就是第一性原理计算的工具,和机器学习的工具整合成一个平台,做成平台即服务(Platform as a Service)的模式,也做了一个业内比较知名的产品。在做这个产品的过程中,我的心得体会是,在化学材料领域,终端应用研发部门和学术界最先进的机器学习/计算技术有很大的代差。这导致一个问题:平台如果想推动化学材料领域中的巨头企业使用自己的产品,需要花费大量的精力做用户界面,即在工程和包装层面花时间。同时,因为 AI for Science 是一个很新的领域,学科的深度还在逐渐增加,这导致做平台(platform)的过程中两者兼顾的难度非常高。因此我和皓钧的想法是,我们都是做科学研究出身,我们想做的事情是把 AI for Science 做得更深入,而不是单做平台的整合。这也和深度原理科技的整个产品路线图和商业模式有关,这是我出来创业的契机。
周天意:你们是怎么认识的,如何从同学演变成创业伙伴?听说一开始辰儒想在学界或者业界发展,皓钧最初想做的是另一个创业方向?
贾皓钧:我们俩以前是同一个导师 Prof. Heather Kulik,在同一个实验室里。我到 MIT 正式约着见面聊天的第一个人就是辰儒,印象特别好,人特别 nice,对学术很热爱也很有见解。后来我们在同 Prof. Heather Kulik 实验室里,很长时间都在一起工作,基本贯穿了我的整个博士生涯。我的确一开始是想做另一个创业方向,后来还是聚焦在 AI+ 催化或者 AI+化学材料这个领域。一开始辰儒没有加入,就是因为我之前知道他之前想找教职,后来当两个人的规划都和 AI+化学材料创业相关之后,就一拍即合一起创业了。
我认为一起创业最重要的第一是信任,第二是互补。创业早期人少,需要双方非常信任才能做起来,我和辰儒已经一起工作了好几年,对双方的能力、人品都有非常强的认知。其次,我们虽然以前是同一个组的,但是做的方向有差异,我主要做的是量子化学计算,辰儒是 AI 和化学算法,此外是性格方面,我侧重组织和协调,他有很强的学术领导力。
段辰儒:我自己心态的变化,主要来自在微软工作期间。看到自己做的东西在工业界的实用性,只不过目前使用的壁垒有点高。这推动了我往这个行业里面继续深挖的想法,同时感受到了现在是深挖 AI for Science 化学材料应用场景的时机。创业对我来说,在某种程度上和我最初想做学术的初衷是一致的。我热爱的是研究和解决问题的过程,初创公司这个形式非常适合去实现它,此外是在工业界接触这些化学材料公司,看到他们的变化和需求,让我看到了这个机会窗口。
周天意:当你们发生意见不合的时候,会怎么解决?
贾皓钧:其实创始人之间吵架甚至翻脸都很常见,我们在初期的时候讨论过处理争端的一系列解决方案,但后来我们认识创业前后这么多年,似乎连生气脸红的次数都几乎为零。我觉得往往争吵源自认知,认知首先来自思维方式,其次是对信息的处理。我们俩是理工科背景,都强调逻辑,所以我们相信通常针对一个事情有不和,大概率是来自信息差,我个人认为要解决的办法就是多沟通,理顺每个人的 mindset,可以解决绝大部分问题。
周天意:你们应该算是第一批将 GenAI 放到化学流程里面的创业公司,你们对这个想法,期待的成果是什么?
段辰儒:当时大家已经把 Generative AI,尤其是 Diffusion Model 相关的东西运用在了一些纯的小分子生成和生物里面,但这里面其实都只涉及到生成一个分子。但我在 2022 年办 AI for Science workshop 时和一个小伙伴聊到这件事情的时候发现,大家好像并没有往化学中真正关系的方向去做。原因和刚才皓钧说过的一样,计算机科学有一个问题,是它追热点的程度比其他领域要高非常多,生物在 AI 领域做得非常多,所以大家很多人都往那个方向去,反而是在化学的这个领域,基本没有人做。
我们当时就想,化学里面最重要的问题是什么?从本质上说,首先我们所有的材料,手机的钛合金外壳,喝水的塑料杯子,都是稳定的材料。稳定在化学上定义即为一个势能面上的极小点。化学研究的过程,或者是化学反应,其实就是一个极小点到另外一个极小点的过程。所以我们就想怎么样用扩散模型生成化学反应,这当然过程中有非常多技术问题,尤其是之前的 Diffusion Model 和图神经网络不能保证化学反应中一些特有的对称性。我们在这个方面做了比较大的改进,第一次研发出了一套图神经网络,来保证整个化学反应的对称性。其次,我们把它结合在 Diffusion Model 的架构中,做整个化学反应的生成。最后我们聚焦到了过渡态的搜索,让这个过渡态的搜索速度提高了 1000 倍左右。从原本需要几个小时甚至超过一天时间缩短到十秒以内。
一开始,我想到这件事情可以做,但没有想到整个效果会这么好,精度能这么高。我们目前生成的过渡态已经基本上可以和实验上的一些的反应速率进行对比了。虽然反应速率仍会差一个数量级,但实际上已让我们看到“计算和AI引导实验”的可能。
周天意:在深度原理科技创业的这个领域。国外和国内大致的格局是什么样的,国内是以高校老师为主吗?国外是否像微软比较突出?在这个方面,Deep Principle 所做的事情,回到国内是否有些填补空白的意义?
贾皓钧:国外的格局,最早是一些大的科技公司来做的,做得比较好的有不少。第一个应该就属微软。Microsoft 应该是在全世界有 4 个 AI for Science 研究院。大概有 200-300 人,分别在欧洲几个地方和北京。Google 那边就是 DeepMind,DeepMind 和 Google Brain 合并之前,分别有几个组在做,尤其是做药物和材料发现。Nvidia 也有两个组,一个在做 AI for drug discovery,一个是 AI for material discovery。Nvidia 应该是源自笃定科学计算是未来的重要方向,做算法平台来更好的进一步研发 GPU,就是适配性的来做科学计算 GPU。Meta 有一个组叫 Open Catalyst,这个可能跟我们的相关度比较强。这些是几家大公司的情况。
在初创公司方面,比较强相关的是依托于 DeepMind 的 Isomorphic Labs,还有一家融资额度很大的公司 SandBox AQ,Google 前 CEO Eric Schmidt 投资的,第一次融资单笔 5 亿美元。在国内,更早的有一系列做 AI for drug discovery 的公司,另外从技术层面上 AI for Science 这个领域,深势科技做得挺好的。
段辰儒:我补充几点,AI for Science 这个领域最近几个月有不少大新闻,比如 Isomorphic Labs,最近和 Novartis、Eli Lilly 达成了 30 亿美元的订单。作为一个创业公司,能和大药厂合作共研,这是个很让人兴奋的事情,这表明大型公司在考虑收缩自己的研发,把更多的研发资源和机会开放给小的创业公司一起合作。这对大公司的经济效益是一个利好,也对创业公司的成长环境是一个改善。
另外在生物方面,Xaira Therapeutics,是美国国家科学院士、华盛顿大学教授 David Baker 和前 Stanford 校长一起创办的,和生物有关,也通过 Generative AI 做更加复杂的蛋白药物设计。在目前的市场情况下,第一轮融资额度,公开的是 10 亿美元。这个融资的额度在 Biotech 和 Pharma 创业方面是史无前例的,也是美国这边 VC 对整个这个方向上的表态。
另外,也有个别和我们类似的创业公司在出现,方向上略有差异,说明大家都在看好这个领域。
周天意:从技术的角度,从创业到现在克服的困难有哪些?
段辰儒:很多人评价做 AI for Science 的不少人是不管有什么新的模型,都拿过来抄一抄用到化学问题上。我觉得有一部分正确,因为做 AI for Science,本质不主张做模型和架构设计,目前 Transformer、Diffusion Model的初始应用都是在 CV 或者 NLP 领域,因为计算机科学(CS)的人就是做 AI方法开发的,而 AI for Science 本身的定位不是做 AI 方法开发。
尤其在化学领域,我们处理的问题的对称性和他们的问题完全不一样,例如 NLP 和 CV 领域都完全不需要考虑对称性。一只猫,无论是正着放它的照片还是反着放它的照片,它都是同一只猫。但在计算机科学领域,一般不会把对称性直接考虑到模型架构中,它的做法是不断地把猫旋转,再放到训练集里,通过大量增加训练次数,让模型学到正的猫和反的猫都是一样的。
而我们在做 3D 的分子,因为化学和材料中处理的很多问题是三维的,而且我们要的结果的颗粒度更加精细,例如原子是碳原子,就得是碳原子,它不能是氮,即使碳和氮只差了一个元素。又例如碳氢键是 1.1 埃,预测的结果是 1.0 埃都是错的。因此,对精细程度的要求反过来要求我们在设计模型的时候考虑到对称性,这是我认为在 AI for Science 技术上的特点,也是一个难点,需要不断的攻克。
周天意:通常对创业公司而言,完成一个个挑战对打磨团队有积极作用。刚才谈的是技术方面,在运营方面,可以分享一个最近的正反馈吗?
贾皓钧:早期招聘非常重要,需要优秀的 talent 才可以打造出有创造力的团队。分享一个招聘的例子,大家都知道早期团队招人很难,甚至有其他创业的朋友跟我说招人一定要做好心理准备,会很难。要说服别人来做这个事情,首先肯定是愿意放弃短期利益,而且工作强度更大,我的一个原则是核心团队要招比我强的人,要在某个领域,比如技术分支、BD 或者运营都可以,一定要在某个领域比我强。我也一直相信想要吸引 A 类人才的最好方式就是邀请 Ta 跟一系列的 A 类人才一起共事一起前进,因此我们在招人上花了很大的精力,在这部分设置的要求一直很高,从来没有妥协过。我们后来发的招聘的推文,看起来是一篇文章,但是背后的思考和讨论其实特别多。后来的效果,从文章的阅读量到收到的简历数量,再到后来招到的人,我们目前觉得结果还是超出预期的。目前,我们正在完成这一轮的招聘,欢迎对我们感兴趣的小伙伴随时联系我们。
周天意:如果一切顺利,未来想做成一家什么样的公司?
段辰儒:如果一切顺利,从大方向讲,我希望能够改变现有化学材料的产业格局,转到更加偏 Biotech 和 Pharma 的模式,让化学材料公司将更多的材料创新下放给专门做材料创新的公司。这个模式只有当我们的研发能力变得足够强才可以做,核心是有一个自己内部的化学材料研发平台,能够不断产生一些目前还没有办法产业化、但一旦产业化能够带来非常大价值的管线,这些管线通过实验室以及初步的工业验证之后能够直接和化学材料公司有深度合作。我们最后想做的不是一个 Software as a Service 或者 Platform as a Service 的公司,我们希望能够直接通过现在 AI for Science 的方法论改变化学材料研发的格局。
贾皓钧:材料化学和生物科技几乎是一样大的领域,但是由于种种问题,它一直没有像生物科技那样发展到一个非常细分的程度。但是由于 AI 技术带来的机会,我觉得很可能会产生一个新的范式,拿 AI 或材料计算、材料发现来驱动整体研发格局发生变化。
段辰儒:传统的研发一直是大公司做的,生物科技比较早认识到自己最重要的是分发和产品化、对工业链的把控,对新药的研发、生产,通过培养之后卖管线。但是在材料化学领域还没有培养出这样的模式,最近是一个比较好的契机,由于全球经济的低迷,越来越多的材料化学企业认识到自己在研发方面有这么大的投入,却没有达到所期望的效果,这和企业内部的模式和思维方式相关,但就目前来看他们的动作是逐渐减少管线研发,往 Biotech Pharma 方向发展,这就是对我们这些新企业的机遇。
周天意:怎么认识的线性,和线性交流的过程中有什么感触?
贾皓钧:别人问我关于线性的故事,我是这么讲的。第一部分,有一天睡醒看到好几个人加我微信,其中有一个叫曾颖哲的人加我,写着「线性资本」,我以为是某个实习生,一查发现是个合伙人。当时我们还没打算开始融资,但聊了一次感受特别好,人很亲切,对行业的认知也很强。我以前做过学生会主席,基金的合伙人也见过不少,但这次是第一次见到会实际如此一线做这么具体事情的基金合伙人,我觉得这很难得。对早期项目而言,在没有那么多财务数据和清晰的产品的情况下,认知非常重要。后来接触天意,也是我见到的很多的年轻投资人中,最懂技术和懂市场的人,既懂 AI 又懂化学材料。
另一方面,因为我们当时人还在国外,和团队暂时没法线下见面,但是能看到线性团队在想办法克服这些困难,无论是在沟通交流推动决策,还是投资前也给我们提供了一些协助,都尽了很大的努力和给了很大的支持。
联系深度原理科技团队请关注「深度原理」公众号