梁文锋传奇人生超乎想象

媒体滚动 2025.02.21 05:51

转自：沈阳晚报

中国对冲基金幻方量化创始人梁文锋开发的AI开源模型DeepSeek，比肩OpenAI模型且成本低，技术开源促进AI应用。

获游戏科学创始人冯骥力荐。

DeepSeek的崛起印证本土科技力量，梁文锋的奋斗历程励志，DeepSeek未来备受期待。

现象级事件

DeepSeek横空出世引发世界级轰动

中国对冲基金幻方量化创始人梁文锋领导开发的AI开源模型DeepSeek，近来引起世界级轰动。原因至少有这么三个：在技术层面，DeepSeek先后推出的DeepSeek V3和 DeepSeek-R1两款模型，在能力上几乎可以分别比肩OpenAI的GPT-4o和o1模型；与OpenAI的GPT-4o和o1模型相比，DeepSeek的V3和R1模型在研发成本方面要低得多；DeepSeek将V3和R1模型的技术都开源，让更多的AI团队，能够基于最先进且成本最低的模型，开发更多的AI应用。

《黑神话：悟空》制作人冯骥站台

DeepSeek同时实现六大惊人突破“6到不真实”

游戏科学创始人、《黑神话：悟空》制作人冯骥在微博发布长文，极力推荐名为DeepSeek的国产AI大模型。他直言：“这可能是国运级别的科技成果。”作为深耕技术领域的行业领军者，冯骥鲜少公开为他人的技术产品站台。对于DeepSeek，他在微博上此番发声可谓情绪值拉满。

冯骥在博文中用“暴论”开篇，并列举了DeepSeek同时实现的六大惊人突破——每一项单拎出来都足以震动世人，而DeepSeek却全部做到了：可以比肩OpenAI付费版ChatGPT o1模型的推理能力，暂时没有之一；参数规模更小，训练和使用的经济门槛大幅下降，让普惠AI成为可能；模型、论文、训练细节全部公开，甚至提供可运行在手机端的迷你版，技术透明度高；官方服务零门槛开放，用户无需付费即可体验到世界顶尖AI模型能力；暂时唯一支持联网搜索的推理模型，反观OpenAI付费版ChatGPT o1推理模型至今还不支持联网搜索；开发团队由毫无海外背景的年轻中国工程师组成，印证本土科技力量的崛起。“这六条，DeepSeek全部、同时做到了。”冯骥感叹，“6到不真实。”

深度求索

梁文锋，究竟是何许人也？

作为DeepSeek的创始人，梁文锋如今无疑已成为人工智能AI领域的代表性人物。那么，梁文锋究竟是何许人也？

1985年，梁文锋出生于广东湛江。童年时期的成长轨迹虽难以追溯，但公开信息显示，他在访谈中提到父亲是一名小学老师。自幼，他便对数学建模展现出浓厚兴趣，这一兴趣如同种子在他心中扎根生长。

2002年，17岁的梁文锋凭借优异成绩考入浙江大学电子信息工程专业。2007年，22岁的他又考上浙江大学信息与通信工程专业硕士，师从项志宇，主修机器视觉。

有消息称，大疆创始人汪滔曾邀请梁文锋共同创业，彼时大疆正处于起步阶段。若梁文锋加入，或许也能实现财富自由。但他坚信人工智能AI将改变世界，最终决定独立创业。

接触到量化投资，创立杭州幻方

在探索过程中，梁文锋接触到量化投资。当时，量化投资在国内还是新鲜事物，但他敏锐地察觉到其中的潜力，坚信自己能在这个领域闯出一片天地。为掌握量化投资的核心技术，他开始疯狂学习金融知识。他购置大量金融书籍，从经典金融理论著作到最新量化投资研究报告，如饥似渴地阅读。同时，他报名参加各种金融培训课程，利用网络资源，学习国内外顶尖量化投资机构的经验与方法。

2010年6月，25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业。硕士毕业后的第三年，28岁的梁文锋将人工智能AI与量化交易结合，和同是浙江大学的校友徐进等人创立了雅克比投资（杭州雅克比投资管理有限公司）。2015年，他们共同创立杭州幻方科技有限公司，也就是今天的浙江九章资产管理有限公司，次年又成立了宁波幻方量化投资管理合伙企业（有限合伙）。

量化投资，简单来说，就是利用数学模型和计算机技术，对金融市场的数据进行分析和预测，从而制定投资策略，即通过计算机取代人，以数量化方式程序化发出买卖指令。这是一个融合金融、数学和计算机科学的交叉领域，需要具备深厚的专业知识和强大的技术能力。

经过几年发展，幻方量化在国内迅速崛起。2016年10月，幻方量化推出第一个AI模型，第一份由深度学习生成的交易仓位上线执行。到2017年底，几乎所有量化策略都采用AI模型计算。2019年，幻方量化管理规模突破百亿，成为国内量化私募“四巨头”之一。

迎来新挑战，大规模布局AI算力

接下来回到AI的话题。随着幻方量化基金规模不断膨胀，梁文锋迎来新挑战。AI交易策略对算力的需求与日俱增，尤其是随着模型参数不断激增，每一次策略优化和模型训练都像是一场对算力的疯狂“掠夺”。GPU芯片算力成为制约幻方量化发展的关键因素，如同高速行驶的汽车突然面临燃料不足的困境。

面对这一棘手问题，梁文锋果断做出大胆决策——大规模布局AI算力。在他看来，算力是未来科技竞争的核心，谁掌握强大算力，谁就能在这场科技革命中抢占先机。

2019年，幻方量化投资2亿元人民币，建成“萤火一号”AI算力集群。该集群搭载1100块GPU算卡。彼时，特斯拉才刚刚提出Dojo超算概念，而幻方量化已在算力领域迈出坚实一步。

幻方量化在算力领域世界领先

但梁文锋并未满足于此。几个月后，当英伟达发布最新的A100芯片时，他再次展现出敏锐洞察力和果断行动力，抢在众多竞争对手之前，成为亚太地区第一批拿到A100 GPU芯片的人。这一举措让幻方量化在算力竞赛中再次占据领先地位。

2021年，梁文锋再次豪掷10亿元，建成“萤火二号”。这个庞然大物搭载1万A100 GPU算卡——算力相当于76万台个人电脑，占地面积比10个篮球场还要大。“萤火二号”的建成，标志着幻方量化在算力领域已达到世界领先水平。

成立DeepSeek，全力进军AI大模型

2023年，随着ChatGPT的爆火，AI大模型成为全球科技领域的焦点，一场没有硝烟的大模型竞赛在全球范围内激烈展开。百度、腾讯、阿里巴巴、字节跳动等国内互联网巨头纷纷入局，投入大量资源进行大模型研发。在这场激烈竞争中，梁文锋看到了人工智能领域的巨大潜力和无限可能，他毅然决然地做出重大决定——成立DeepSeek，全力进军AI大模型研究开发领域，致力于通用人工智能（AGI）的探索。

在团队组建方面，一群来自清华、北大、北航等中国顶尖高校的应届毕业生、在读生以及毕业才几年的年轻人，汇聚在DeepSeek。

在DeepSeek，团队采用扁平化管理模式，淡化职级，鼓励员工自由交流与合作。这种管理模式极大地激发了员工的积极性和创造力，让他们能够充分发挥自己的才能。

将DeepSeek的模型开源

打破技术壁垒

在梁文锋心中，AI不应是少数人手中的“奢侈品”，而应是普惠大众的“工具”，让每个人都能从中受益。他深知，开源文化是实现这一目标的关键。通过将DeepSeek的模型开源，他希望打破技术壁垒，让更多开发者和企业能够基于开源模型进行创新和应用开发。

同时，梁文锋还致力于降低AI的使用成本。他通过技术创新，不断优化模型的性能和效率，使得DeepSeek的模型在保持高性能的同时，推理成本大幅降低。这使得中小企业和个人开发者也能够负担得起AI技术的使用，为AI的普及和应用提供了更广阔的空间。

拭目以待

未来DeepSeek

能否继续

给世界带来

更大震撼？

Scale AI创始人兼CEO Alexandr Wang在一个节目中表示：中美之间在AI领域的竞争至关重要，被认为是当今最重要的议题之一，并且中国的AI能力正在迅速赶超美国，在某些方面甚至可以与美国顶尖模型相媲美，这出乎许多人的意料。Scale AI发布了名为 “Humanity's last exam”的AI模型评估基准，该基准由数学、物理、生物、化学等领域的教授设计，旨在测试AI模型的极限能力，中国AI实验室DeepSeek开发的模型在该基准测试中表现出色，与美国的顶尖模型(如ChatGPT o1)性能相当。

可以这么认为，幻方量化和DeepSeek，是中国市场经济环境下的一个产物——这也是为什么说DeepSeek的在全球AI领域的异军突起，既是偶然，也是必然。

未来DeepSeek能否继续给世界带来更大的震撼？想必已有很多人在期待……

（本版稿件为本报综合）

梁文锋 传奇人生 超乎想象

梁文锋传奇人生超乎想象