新浪财经

百度 :探索做大做强大模型产业生态“成功密码”

网站滚动

关注

转自:经济日报

“大模型的产业模式是在基础通用大模型之上结合场景进行广泛应用创新,建设面向未来的产业生态链。”百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜日前在上海举办的“智能科技与未来产业发展”论坛上表示,大模型的产业化模式是在基础通用大模型之上结合行业领域特有的数据、知识和专家经验,既具有基础模型的能力,又具有行业领域的专有能力。

今年以来,大模型技术受到公众关注,大语言模型展现出类似于人的智力表现、非常强的通用能力,带来更广泛的应用想象空间。吴甜介绍,百度从2019年开始大模型技术的研发,推出文心大模型1.0版本,目前已升级到文心4.0,在理解、生成、逻辑、记忆四大核心能力上显著提升。今年3月16日上线“文心一言”。文心一言从数万亿数据和数千亿知识中融合学习,训练出优秀的基础模型,采用有监督精调、人类反馈强化学习、提示等技术进一步优化,还具备知识增强、检索增强和对话增强的特色技术优势。

吴甜表示,大模型与实体经济的结合,能利用各方面更强的能力,深入到整个系统流程中,未来能够基于大模型在行业应用中形成“智能体”,将给各行业带来极大的效率提升,进而带来很多的创造性,想象空间会非常大,这是未来很重要的发展方向。

AI大模型已经成为科技创新的竞争高地。我国大模型实现可持续良性发展的关键在于大模型产业生态能否做大做强。谈及产业生态,吴甜认为目前整个产业还处于非常初期的阶段,亟需构建面向未来的产业链条。

以百度为例,自2010年起,百度全面布局人工智能,从昆仑芯片、飞桨深度学习平台、文心大模型到广泛应用层,百度形成了四层AI技术架构布局,实现了层与层反馈,端到端优化,大幅提升效率。AI产业生态链最底层是硬件,硬件性能发挥的关键点之一是软件栈,基础软硬件平台的打造是整个生态的基础。百度自研的飞桨深度学习平台,上承模型应用、下接硬件芯片,目前已携手10多家国产硬件厂商适配文心大模型。最新版本文心大模型4.0的模型周均训练有效率超过98%,相比于3月份,训练算法效率提升至3.6倍,推理性能提升至50倍。

产业生态应用层的空间更大,始终在探索“成功密码”。 吴甜表示,在基础通用大模型之上,结合行业特有的数据、知识和专家经验,进行优化训练,形成行业垂直领域模型,可以在行业中探索更丰富的应用。(经济日报记者 李治国)

加载中...