新浪财经

阿里通义千问:从模型到生态全方位领先

市场资讯 2024.05.28 10:32

特别声明

特别声明《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》于2017年7月1日起正式实施。通过新媒体形式制作的本公众号推送信息仅面向西部证券的专业投资者。若您并非西部证券的专业投资者。请取消关注本公众号,不再订阅、接收或使用本公众号中的任何推送信息。因本公众号受限于访问权限的设置,若给您造成不便,烦请谅解!感谢您给予的理解与配合。

从模型到应用,从技术能力到生态建设,阿里云在大模型时代全方位领跑。

· 基模型:通义千问2.5性能比肩GPT-4 Turbo,在文档处理能力、音视频理解能力、代码编写等方面优势显著。2024年5月9日,阿里云正式发布通义千问2.5,在上海AI实验室推出的权威基准OpenCompass上的得分追平了GPT-4 Turbo,是国产大模型中首个达到此成就的。

1)文档处理能力:通义千问2.5支持单次最长1000万字、100个文档,覆盖PDF、Word、Excel等多种文件格式,可解析标题、段落、图表等多种数据格式。

2)音视频理解能力:通义千问2.5融合语音、LLM、多模态、翻译能力,具备实时语音识别、说话人分离功能,能够提取全文摘要、总结发言、提取关键词等,可同时上传处理50个音视频文件。

3)智能编码:通义灵码掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码等。

· 开源模型:阿里通义沿“全模态+全尺寸”路线前行,Qwen1.5-110B超越Llama-3-70B。

通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。其中,Qwen1.5-110B在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型,在Hugging Face开源大模型排行榜Open LLM Leaderboard中登上榜首。

· 生态:IaaS+PaaS+MaaS三位一体,在多个行业实现大模型商业化落地。

大模型服务平台百炼2.0实现模型到应用全链条打通,5到10行代码即可搭建企业级RAG应用。2023年10月,阿里云发布了百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时微调出一个专属模型。2024年5月,阿里云发布更加易用、更加开放、引入更多模型的百炼2.0;同时针对企业最关注的RAG链路,提供灵活开放的企业级检索增强服务,5到10行代码即能帮助企业搭建RAG应用。

根据阿里云数据,通义通过阿里云服务企业超过9万,通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

AI技术突破不及预期、AI商业化落地不及预期、宏观经济增长不及预期、国际环境变化。

通义大模型步履不停,不断缩短与国际头部大模型距离,通义千问2.5性能赶超GPT-4 Turbo。2019年,阿里达摩院开始投入大模型研发,在语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面做了许多探索;2022年10月,阿里云在业界首次提出MaaS(模型即服务)理念,并发布AI模型社区“魔搭”。

2023年4月,阿里云峰会上,“通义千问”正式发布;2023年10月31日,阿里云发布了通义千问2.0版本,综合性能超越了当时的GPT-3.5。2024年5月9日,阿里云发布通义千问2.5,综合性能比肩GPT-4 Turbo。相比上一版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,其中中文语境下的文本生成和理解、 知识问答、生活建议、闲聊对话等垂直场景的能力更是赶超 GPT-4,成为中文社区最佳选择。在上海权威基准OpenCompass榜单上,通义千问2.5得分超越Claude 3 Opus,追平GPT-4 Turbo,成为国产大模型首位。

通义是开源大模型坚定践行者,推出参数规模横跨5亿到1100亿的8款大语言模型,以开放心态全面使能开发者,加速大模型应用落地。2023年8月,通义宣布加入开源行列,沿着“全模态、全尺寸”开源的路线,陆续推出8款开源大语言模型;此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。目前,通义开源模型下载量已经超过700万。

IaaS+PaaS+MaaS三位一体,通义大模型生态逐步成形。

算力方面,灵骏智算集群与PAI平台共同构成了一个高性能、分布式的智能计算平台。阿里云的灵骏智算集群支持最高10万张卡的GPU规模,自研的高速RDMA链路达3.2Tbps,网络最低时延1.5μs,并行存储吞吐量可达20TB/s,能够同时训练多个万亿参数的大模型。同时,阿里云提供软硬件加速服务PAI机器学习平台,可以大幅提升AI开发和AI资源管理的效率,

大模型服务平台方面,百炼2.0助力企业实现模型开箱即用和快速定制化。阿里云CTO认为“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用。其中最典型的需求是RAG,以企业数据对大模型进行知识增强。” 。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱,同时提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。

大模型商业化落地先行者,通义大模型已赋能百万企业。目前,通义大模型通过阿里云服务的企业客户数已超过9万,通过钉钉服务企业超220万,其中月活超170万;与小米旗下的AI助手“小爱同学”达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。

             分析师声明             

             免责声明             

证券研究报告:《AI行业跟踪点评 -- 阿里通义千问:从模型到生态全方位领先》

对外发布时间:2024年5月27日

对外发布机构:西部证券研究发展中心

参与人员信息:

分析师:郑宏达 

执业编号:S0800524020001

邮箱:zhenghongda@research.xbmail.com.cn

在任何情况下,本公众号所载的观点、结论和建议仅供投资者参考之用,并非作为购买或出售证券或其他投资标的的邀请或保证。客户不应以本公众号取代其独立判断或根据本报告做出决策。该等观点、建议并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本公众号内容,不应视本公众号为做出投资决策的唯一因素,必要时应就法律、商业、财务、税收等方面咨询专业财务顾问的意见。西部证券以往相关研究报告预测与分析的准确,不预示与担保本公众号及西部证券今后相关研究报告的表现。对依据或者使用本公众号及西部证券其他相关研究报告所造成的一切后果,西部证券及作者不承担任何法律责任。

本公众号版权仅为西部证券所有。未经公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号版权。如征得西部证券同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“西部证券研究发展中心”,且不得对本公众号进行任何有悖原意的引用、删节和修改。如未经西部证券授权,私自转载或者转发本公众号,所引起的一切后果及法律责任由私自转载或转发者承担。西部证券保留追究相关责任的权力。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91610000719782242D。

加载中...