新浪科技

智源研究院副院长林咏华:今天的大模型还是偏文科生,对工科类的理解上是相当欠缺的

新浪科技

关注
2023金麒麟论坛郑纬民 王小川 林咏华 对话

新浪科技讯 12月21日下午消息,由新浪财经客户端、新浪科技联合主办的“2023科技风云榜”年度盛典今日开幕,今年活动主题为“智涌·进跃”。在特别对话《科学论道》环节,中国工程院院士、清华大学教授郑纬民,百川智能创始人、CEO王小川,北京智源人工智能研究院副院长兼总工程师林咏华分享精彩观点。

林咏华表示,前阵子做了一个调研,想看看现在模型都用在哪些行业和产业?根据国家统计局在三个产业的分布,三个产业共96个行业,在96个行业里发现现在的大模型主要的这些探索和落地,还是在第三产业。第二产业很少,就是整个在工业里,包括很多制造业、能源这些行业里很少。哪怕第三产业,有的很多都是在比较靠智能客服、智能营销,它跟很深度知识结合方面的应用也很少。

咱们工业,整个领域是对咱们国家国民经济未来技术发展很重要的一块。为什么大模型在里是很少出现?打个比方虽然国网、南网也有大模型落地,包括胜利油田也有,但是主要还是对话机器人而已,就是智能客服。因为今天的大模型还是偏文科生,对于我们工科类很多图、表的理解上是相当欠缺的。

“我觉得本身可能就是从学术界开始,就应该也是需要沉下心来,怎么样让我们的大模型除了今天它展现出来的能力以外,在与工科类能很深的去理解,去支撑这是值得思考的一个问题。”

另外,在国内大模型的算力上,她认为,一个重要的问题是生态。因为作为一些很重要的大型用户企业,就怕我花了很多里迁移到国产芯片上,但是国产芯片再迁移到别的国产芯片上要进行很大的一个迁移。所以怎么样从生态上帮助构建一个开放的开源的生态一直我们一直思考的。智源也是从去年开始,联合国内的一些重要芯片企业一起去探讨,有没有机会我们去打造这种开源开放的底层的软件生态。

第二点是互联互通的问题。现在在数据中心随着芯片的不断迭代,会存在我在一个数据中心里会出现不同家的芯片卡的服务器,也会出现不同芯片的代际,我们是一个模型只能用同一款芯片服务器。中间有很多资源,虽然我们看到很多服务器,这些服务器不是同样的芯片就放不起来是一个大模型。所以现在我们也在做这样的事情,能不能通过底层的并行框架来去打破这样的资源墙。

加载中...