千问大模型跻身全球前三,金融业拥抱大模型成共识
中国经济新闻网
中国经济时报记者 周雪松
9月24日,2025云栖大会开幕,阿里通义旗舰模型Qwen3-Max重磅亮相,性能超过GPT5、Claude Opus 4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性可望再度实现突破。
Qwen3-Max为通义千问家族中最大、最强的基础模型。该模型预训练数据量达36T tokens,总参数超过万亿,拥有极强的Coding编程能力和Agent工具调用能力。在大模型用Coding解决真实世界问题的SWE-Bench Verified测试中,Instruct版本斩获69.6分,位列全球第一梯队;在聚焦Agent工具调用能力的Tau2-Bench测试中,Qwen3-Max取得突破性的74.8分,超过Claude Opus4和DeepSeek-V3.1。
同时,阿里云正式发布全新一代服务器操作系统 Alibaba Cloud Linux 4(简称 “Alinux 4”)。Alinux 4 基于 Linux 6.6 内核打造,是首个全面遵循龙蜥社区“开源生态合作倡议”规范的商业发行版。它不仅兼容主流开源社区生态,更针对阿里云最新9代ECS实例深度优化,让协同效率再上台阶。
此外,在2025云栖大会上,记者获悉,中国头部金融机构已经全部接入阿里云AI,包括工商银行、建设银行等国有大行,中信证券、国泰海通、中金公司等头部券商,中国人寿、平安集团、太保集团、中华财险等前十保险公司,以及易方达、汇付天下、同花顺等基金、支付、消金行业头部机构。
随着人工智能技术的飞速发展,全球金融业都在经历着一场由大模型技术引领的变革。安全和合规是金融业的基石,因此金融机构对技术选型的要求十分严苛。金融机构不仅要选择技术能力最强的开源模型实现与业务的高度适配性,创建行业超级智能体,还要从IaaS层确保计算、存储与网络资源的高可用与合规可控,PaaS层实现高效开发、部署与运维一体化,技术架构的每一层都需要支撑金融级业务场景的严格需求。
据统计,通义大模型在金融行业已得到广泛应用,12家股份制银行已实现100%渗透,覆盖70%场景。在研发领域,已有80%的大型银行选择接入通义灵码,AI代码采纳率达40%。此外,头部券商和保险公司也纷纷接入阿里AI。
阿里云智能集团副总裁、新金融行业总经理张翅表示,金融行业要拥抱大模型早已是行业共识,但用AI改造金融业务场景像处理一个“一米宽,百米深”的问题,简单的流程和Agent容易做,但要做深挑战很多。得益于在模型技术的优势和在金融领域的经验积累,阿里云将与金融机构共同推动企业级、金融级的AI原生能力体系建设。