梁文峰 一个几乎改变国运的人
来源:新青年馆
今天的港股市场有些疯狂,甚至已经疯涨了半个月,恒指正在超2021年的高点发起冲击,如果这一切有个导火索那估计就是梁文峰的deepseek,从人人喊打的量化,到做出国运级别的大模型。
1985 年,梁文峰出生于广东省湛江市的一个教师家庭,父母都是小学语文老师。2002 年,他凭借优异的成绩考入浙江大学电子信息工程专业,后继续深造,于 2010 年获得信息与通信工程硕士学位,其硕士论文题目是《基于低成本 PTZ 摄像机的目标跟踪算法研究》。
在大学期间,梁文峰对金融市场产生了浓厚的兴趣。2008 年全球金融危机之际,他察觉到机器学习技术在全自动量化交易中的应用潜力,便开始了相关探索,这一经历为他日后的职业生涯埋下了种子。
2013 年,梁文峰与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015 年,他又创立了杭州幻方科技有限公司,也就是后来广为人知的幻方量化,致力于通过数学和人工智能进行量化投资。在成立初期,幻方量化面临着诸多挑战,市场波动频繁,但梁文峰团队凭高频量化策略,在 2015 年的市场波动中取得了成绩,逐渐在量化投资领域崭露头角。
2016 年 10 月,幻方量化推出第一个 AI 模型,第一份由深度学习生成的交易仓位上线执行,这是幻方量化发展历程中的一个重要里程碑,标志着公司开始向人工智能量化投资方向迈进。到 2017 年底,幻方量化几乎所有的量化策略都采用 AI 模型计算,AI 在公司的业务中占据了核心地位。2018 年,幻方正式确立了以 AI 为核心的发展战略。随着业务的快速扩展,算力瓶颈逐渐显现,为了解决这一问题,2019 年,梁文峰研发了 “萤火一号” 训练平台,总投资近 2 亿元,搭载了 1100 块 GPU,大大提升了公司的算力水平,为量化策略的优化和创新提供了有力支持。同年 8 月 30 日,梁文峰在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议,他对量化投资的见解和思考,让更多人关注到了幻方量化以及量化投资领域的发展潜力。
两年后,为了进一步提升算力,满足不断增长的业务需求,梁文峰团队研发 “萤火二号” 的投入增加到 10 亿元,搭载了约 1 万张英伟达 A100 显卡,使得幻方量化在算力方面处于行业领先地位。强大的算力支持下,幻方量化的业务飞速发展,2021 年,其资产管理规模突破千亿大关,跻身国内量化私募领域的 “四大天王” 之列,成为行业内的佼佼者。然而,量化投资市场风云变幻,2025 年 2 月,有市场消息称幻方量化的管理规模极度缩水,降至 100 多亿元,后经幻方量化市场部工作人员回应,目前规模有 200 多亿元 ,并表示属于正常的规模变动。也有业内人士分析,通常量化私募基金规模包括自营和资管两部分,“200 多亿元的规模” 可能只是资管口径数据,没包含自营资金部分,且幻方量化早已主动封盘,不接纳外来资金,资管部分规模下滑属正常现象 ,若算上自营资金,其管理总规模并不小。
在幻方量化取得成功后,梁文峰在2023 年 5 月,宣布进军通用人工智能 (AGI) 领域,7 月,正式创办杭州深度求索人工智能基础技术研究有限公司 (DeepSeek),专注于 AI 大模型的研究和开发。
2024 年 5 月,DeepSeek 发布混合专家语言模型 DeepSeek-V2,该模型凭借创新的模型架构和超高的性价比引发热议出圈。DeepSeek-V2 的推理成本被降到每百万 token 仅 1 块钱,约等于 GPT-4 Turbo 的七十分之一,让大模型的应用成本大幅降低,使得更多企业和个人能够享受到人工智能带来的便利,因此 DeepSeek 被称为 “AI 界的拼多多”。同年 12 月 26 日,DeepSeek 宣布上线并同步开源 DeepSeek-V3 模型,并公布了长达 53 页的训练和技术细节。模型测算数据显示,DeepSeek-V3 虽然在文字生成类任务上表现相对较弱,但其代码、逻辑推理和数学推理能力均名列前茅。而且,DeepSeek-V3 整个训练过程仅用了不到 280 万个 GPU 小时,按每 GPU 小时 2 美元计算,模型全部训练成本仅为 557.6 万美元 (约 4000 万元人民币),这一成本几乎是 GPT-4 训练成本的二十分之一,再次展示了 DeepSeek 在模型训练成本控制方面的优势。
2025 年 1 月 20 日晚,DeepSeek 正式发布 DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,并且 DeepSeek 同步开源模型权重,还表示将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。随着 DeepSeek 的快速发展,梁文峰的个人财富也急剧增长,据外媒估算,由于其持有公司 84% 的股份,身家可能已经超过 16 亿美元,并且有望成为中国首富,给出最低估值的是波士顿风险投资公司 Glasswing Ventures 的创始人鲁迪纳・塞塞里,认为按照同行公司的估值,DeepSeek 最少值 10 亿美元;给出最高估值的是 Sweat Free Telecom 的创始人查纳基亚・拉姆德夫,直接给出了 1550 亿美元的估值 。
责任编辑:石秀珍 SF183