新浪科技

梁文锋 传奇人生 超乎想象

媒体滚动 2025.02.21 05:51

转自:沈阳晚报

中国对冲基金幻方量化创始人梁文锋开发的AI开源模型DeepSeek,比肩OpenAI模型且成本低,技术开源促进AI应用。

获游戏科学创始人冯骥力荐。

DeepSeek的崛起印证本土科技力量,梁文锋的奋斗历程励志,DeepSeek未来备受期待。

现象级事件

DeepSeek横空出世引发世界级轰动

中国对冲基金幻方量化创始人梁文锋领导开发的AI开源模型DeepSeek,近来引起世界级轰动。原因至少有这么三个:在技术层面,DeepSeek先后推出的DeepSeek V3和 DeepSeek-R1两款模型,在能力上几乎可以分别比肩OpenAI的GPT-4o和o1模型;与OpenAI的GPT-4o和o1模型相比,DeepSeek的V3和R1模型在研发成本方面要低得多;DeepSeek将V3和R1模型的技术都开源,让更多的AI团队,能够基于最先进且成本最低的模型,开发更多的AI应用。

《黑神话:悟空》制作人冯骥站台

DeepSeek同时实现六大惊人突破“6到不真实”

游戏科学创始人、《黑神话:悟空》制作人冯骥在微博发布长文,极力推荐名为DeepSeek的国产AI大模型。他直言:“这可能是国运级别的科技成果。”作为深耕技术领域的行业领军者,冯骥鲜少公开为他人的技术产品站台。对于DeepSeek,他在微博上此番发声可谓情绪值拉满。

冯骥在博文中用“暴论”开篇,并列举了DeepSeek同时实现的六大惊人突破——每一项单拎出来都足以震动世人,而DeepSeek却全部做到了:可以比肩OpenAI付费版ChatGPT o1模型的推理能力,暂时没有之一;参数规模更小,训练和使用的经济门槛大幅下降,让普惠AI成为可能;模型、论文、训练细节全部公开,甚至提供可运行在手机端的迷你版,技术透明度高;官方服务零门槛开放,用户无需付费即可体验到世界顶尖AI模型能力;暂时唯一支持联网搜索的推理模型,反观OpenAI付费版ChatGPT o1推理模型至今还不支持联网搜索;开发团队由毫无海外背景的年轻中国工程师组成,印证本土科技力量的崛起。“这六条,DeepSeek全部、同时做到了。”冯骥感叹,“6到不真实。”

深度求索

梁文锋,究竟是何许人也?

作为DeepSeek的创始人,梁文锋如今无疑已成为人工智能AI领域的代表性人物。那么,梁文锋究竟是何许人也?

1985年,梁文锋出生于广东湛江。童年时期的成长轨迹虽难以追溯,但公开信息显示,他在访谈中提到父亲是一名小学老师。自幼,他便对数学建模展现出浓厚兴趣,这一兴趣如同种子在他心中扎根生长。

2002年,17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年,22岁的他又考上浙江大学信息与通信工程专业硕士,师从项志宇,主修机器视觉。

有消息称,大疆创始人汪滔曾邀请梁文锋共同创业,彼时大疆正处于起步阶段。若梁文锋加入,或许也能实现财富自由。但他坚信人工智能AI将改变世界,最终决定独立创业。

接触到量化投资,创立杭州幻方

在探索过程中,梁文锋接触到量化投资。当时,量化投资在国内还是新鲜事物,但他敏锐地察觉到其中的潜力,坚信自己能在这个领域闯出一片天地。为掌握量化投资的核心技术,他开始疯狂学习金融知识。他购置大量金融书籍,从经典金融理论著作到最新量化投资研究报告,如饥似渴地阅读。同时,他报名参加各种金融培训课程,利用网络资源,学习国内外顶尖量化投资机构的经验与方法。

2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业。硕士毕业后的第三年,28岁的梁文锋将人工智能AI与量化交易结合,和同是浙江大学的校友徐进等人创立了雅克比投资(杭州雅克比投资管理有限公司)。2015年,他们共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产管理有限公司,次年又成立了宁波幻方量化投资管理合伙企业(有限合伙)。

量化投资,简单来说,就是利用数学模型和计算机技术,对金融市场的数据进行分析和预测,从而制定投资策略,即通过计算机取代人,以数量化方式程序化发出买卖指令。这是一个融合金融、数学和计算机科学的交叉领域,需要具备深厚的专业知识和强大的技术能力。

经过几年发展,幻方量化在国内迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有量化策略都采用AI模型计算。2019年,幻方量化管理规模突破百亿,成为国内量化私募“四巨头”之一。

迎来新挑战,大规模布局AI算力

接下来回到AI的话题。随着幻方量化基金规模不断膨胀,梁文锋迎来新挑战。AI交易策略对算力的需求与日俱增,尤其是随着模型参数不断激增,每一次策略优化和模型训练都像是一场对算力的疯狂“掠夺”。GPU芯片算力成为制约幻方量化发展的关键因素,如同高速行驶的汽车突然面临燃料不足的困境。

面对这一棘手问题,梁文锋果断做出大胆决策——大规模布局AI算力。在他看来,算力是未来科技竞争的核心,谁掌握强大算力,谁就能在这场科技革命中抢占先机。

2019年,幻方量化投资2亿元人民币,建成“萤火一号”AI算力集群。该集群搭载1100块GPU算卡。彼时,特斯拉才刚刚提出Dojo超算概念,而幻方量化已在算力领域迈出坚实一步。

幻方量化在算力领域世界领先

但梁文锋并未满足于此。几个月后,当英伟达发布最新的A100芯片时,他再次展现出敏锐洞察力和果断行动力,抢在众多竞争对手之前,成为亚太地区第一批拿到A100 GPU芯片的人。这一举措让幻方量化在算力竞赛中再次占据领先地位。

2021年,梁文锋再次豪掷10亿元,建成“萤火二号”。这个庞然大物搭载1万A100 GPU算卡——算力相当于76万台个人电脑,占地面积比10个篮球场还要大。“萤火二号”的建成,标志着幻方量化在算力领域已达到世界领先水平。

成立DeepSeek,全力进军AI大模型

2023年,随着ChatGPT的爆火,AI大模型成为全球科技领域的焦点,一场没有硝烟的大模型竞赛在全球范围内激烈展开。百度、腾讯、阿里巴巴、字节跳动等国内互联网巨头纷纷入局,投入大量资源进行大模型研发。在这场激烈竞争中,梁文锋看到了人工智能领域的巨大潜力和无限可能,他毅然决然地做出重大决定——成立DeepSeek,全力进军AI大模型研究开发领域,致力于通用人工智能(AGI)的探索。

在团队组建方面,一群来自清华、北大、北航等中国顶尖高校的应届毕业生、在读生以及毕业才几年的年轻人,汇聚在DeepSeek。

在DeepSeek,团队采用扁平化管理模式,淡化职级,鼓励员工自由交流与合作。这种管理模式极大地激发了员工的积极性和创造力,让他们能够充分发挥自己的才能。

将DeepSeek的模型开源

打破技术壁垒

在梁文锋心中,AI不应是少数人手中的“奢侈品”,而应是普惠大众的“工具”,让每个人都能从中受益。他深知,开源文化是实现这一目标的关键。通过将DeepSeek的模型开源,他希望打破技术壁垒,让更多开发者和企业能够基于开源模型进行创新和应用开发。

同时,梁文锋还致力于降低AI的使用成本。他通过技术创新,不断优化模型的性能和效率,使得DeepSeek的模型在保持高性能的同时,推理成本大幅降低。这使得中小企业和个人开发者也能够负担得起AI技术的使用,为AI的普及和应用提供了更广阔的空间。

拭目以待

未来DeepSeek

能否继续

给世界带来

更大震撼?

Scale AI创始人兼CEO Alexandr Wang在一个节目中表示:中美之间在AI领域的竞争至关重要,被认为是当今最重要的议题之一,并且中国的AI能力正在迅速赶超美国,在某些方面甚至可以与美国顶尖模型相媲美,这出乎许多人的意料。Scale AI发布了名为 “Humanity's last exam”的AI模型评估基准,该基准由数学、物理、生物、化学等领域的教授设计,旨在测试AI模型的极限能力,中国AI实验室DeepSeek开发的模型在该基准测试中表现出色,与美国的顶尖模型(如ChatGPT o1)性能相当。

可以这么认为,幻方量化和DeepSeek,是中国市场经济环境下的一个产物——这也是为什么说DeepSeek的在全球AI领域的异军突起,既是偶然,也是必然。

未来DeepSeek能否继续给世界带来更大的震撼?想必已有很多人在期待……

(本版稿件为本报综合)

加载中...