新浪科技

商汤科技发布首个流式交互模型,CEO徐立致敬创始人汤晓鸥

银柿财经

关注

日前,商汤科技于2024 WAIC大会上召开了“大爱无疆·向新力”人工智能论坛,发布模型“日日新5o”,商汤科技董事长兼CEO徐立在论坛发表演讲。

演讲开始,徐立首先致敬了人工智能时代的行业大咖,尤其是商汤科技创始人汤晓鸥,“正是他对人工智能的执着,以及对于人才的培养,我们今天才可以站在这里分享关于人工智能的一些想法。”

据悉,今年4月,商汤科技发布了国内首个对标GPT-4 Turbo的国产大模型“日日新5.0”。两个多月时间过去,全新“日日新5.5”体系迎来多项升级,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。

模型能力的大幅提升,是通过使用大量合成高阶思维链的数据实现的。徐立表示,“现在人工智能的大方向,是在提升基础模型的推理以及逻辑的能力。所以在垂直行业里面怎么构造高阶思维逻辑的合成数据,往往是制胜的关键,并且是差异化的关键。”

其次,“行业要进行变化,交互模式一定是先行的。”商汤科技重点发布的“日日新5o”,是国内首个所见即所得的流式交互的模型。

除了在推理、数理逻辑以及指令跟随等领域的能力,还针对海外国际化市场,把英语能力进行大幅提升。在这个大脑的驱动之下,叠加了混合模态的交互效果,对标 GPT-4o的流式交互。

日前,Open AI宣布对中国内地和中国香港断供。商汤科技就此推出“大模型0元Go”,凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时免费赠送5000万Tokens包,帮助OpenAI用户实现零服务成本迁移。

徐立认为,“现在对行业的认知其实仍在于如何用大模型去赋能行业,且正处在一个关键转折节点,也就是接下来人工智能的超级时刻,有赖于我们共同去营造超级应用。”

“日日新5.5”在端侧加大了模型的优化,提升了10%的性能精度。除此之外,推理速度有大规模的提升,而推理成本大幅度下降。首包延迟下降40%,推理效率提升了15%。

据悉,商量从文本开始,拓展至代码办公、拟人对话、金融、农业等多个垂直行业,推出专属模型和一体机,目前已有超3000家客户。

加载中...