新浪财经

关于腾讯大模型,汤道生的最新分享

砺石商业评论

关注

最近,汤道生关于大模型做了两场演讲,一定程度上代表了腾讯在大模型领域的最新思考。

汤道生 | 演讲

砺石商业评论 | 来源

前不久,2023年腾讯全球数字生态大会在深圳宝安举行。

此次大会上,最受人们关注的便是腾讯混元大模型的发布。其中,在主论坛与行业大模型与智能应用”专场上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生分别做了《腾讯将全面进入大模型时代》与《拥抱产业大模型,助力产业高质量发展》两个主题演讲。

这两个演讲,一定程度上代表了腾讯在大模型领域的最新思考。我们特整理如下,以供关心腾讯以及关心大模型行业发展的读者朋友参考。

演讲1:

尊敬的各位领导、嘉宾、媒体朋友们:

早上好!欢迎大家光临腾讯数字生态大会,非常高兴再一次相聚深圳宝安,在这里,我也特别感谢深圳市政府、宝安区政府,一直以来对我们的大力支持。

从上一届合作伙伴大会到现在,虽然只有一年的时间,但我们与宝安的合作,进展迅速。腾讯云工业互联网总部基地,已经助力了300多家宝安企业的数字化转型;“大湾区人工智能创新中心”和“智能网联技术创新联合实验室”先后建成,全面拥抱人工智能时代。

这是争分夺秒的深圳速度,也是全国各地、各行各业加速拥抱产业互联网的真实写照。产业数字化,越来越多从构想走向现实。腾讯对实体产业的助力,覆盖越来越广,场景越来越深,能力越来越强,我们与合作伙伴的定位与协同,分工越来越清晰,生态也越来越繁荣。

我们深信产品为王,坚定做扎实的技术,构建性能卓越、自主可控的云产品体系。

五年来,腾讯的研发投入超过2300亿,在核心数字科技的许多领域,实现了性能的突破。比如在音视频领域,腾讯编码器在MSU世界大赛中,一次性包揽了全部15个世界冠军。又比如,结合了腾讯云高性能的星星海服务器、深度优化的操作系统Tencent OS与自研数据库TDSQL,腾讯云在最近一次TPC-C性能测试中,创下了每分钟支撑8.14 亿笔交易的世界纪录。此外,我们在人工智能、云原生、音视频通讯、区块链、网络安全等领域,在全球获得专利授权3.3万件,申请总数超过6.6万件,位列中国企业第一名,全球第二。

我们聚焦产业场景,以解决痛点为目标,推动前沿创新加速落地,助力企业降本增效。

在制造领域,腾讯工业互联网平台WeMake连续三年,入选国家级双跨平台,帮助60多万家制造企业,实现了更好的生产管理。在出行领域,我们与45家头部车企合作,通过腾讯生态车联网TAI,为超过800万车主,提供便捷舒适的车上数字生活。在零售领域,我们用云和连接能力,助力600家头部零售企业,提高销售成绩,助力品牌发展,其中60多家企业,在微信私域里销售额突破10亿。在医疗领域,我们的AI导辅诊覆盖全国1000多家医院,为患者提供更准确的咨询、更详尽的解答。

我们让伙伴“唱主角”,共建高质量的数字经济新生态。

我们和1万1千家生态伙伴展开紧密合作,推出覆盖100多个产业场景的行业解决方案,共同服务千行百业。我们提出聚焦产品,在生态体系中做好数字化工具的提供者,将集成、交付、销售等环节,更多交给生态伙伴,请伙伴“唱主角”。彼此定位清晰,分工明确,角色互补。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的4倍。

腾讯的冠军产品,广泛适配和被集成到伙伴的系统中,成为伙伴破局的“尖刀”。例如,我们的数据库TDSQL,就与250多家合作伙伴的业务系统适配,覆盖金融、政务、能源、工业等关键行业。

立足过往,展望未来,我们也正在迎来全新的机遇。正如腾讯董事会主席马化腾先生所说,“人工智能技术的不断增强,让企业获得一种越来越重要的生产工具,将数据中潜藏的‘信息能源’,源源不断地转化为实体经济高质量发展的新动能。” 

以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点,带来了全新的思路:大语言模型让人机交互体验变得更简单,理解意图与操控系统的能力也更强大,大幅度提升数字化在产业中的可用性、易用性。企业的核心中枢,也从由人来驱动,走向由人和机器协同驱动,大大提升决策的质量、响应的速度与执行的效率。

腾讯产业互联网也将全面拥抱智能时代,我们将通过三个“增强”,助力产业建构“智能引擎”,挖掘数据价值,连接场景应用,实现高质量发展。

第一,我们以“智能增强”,构筑产业发展“新动能”。

今天我们也非常高兴地告诉大家,腾讯自主研发的通用大语言模型——混元,正式面向产业亮相!

腾讯混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。目前,混元已经与腾讯的产品,进行了广泛的对接和集成,在腾讯云、腾讯广告、腾讯会议、腾讯文档、微信搜一搜等多个业务线应用,为用户提供更贴心的智能服务,提高工作效率。

同时,我们也诚意邀请各行各业接入体验,企业可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。

我们始终认为,大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。AI通过对企业生产、销售、服务各个环节的影响,助力产业生产效率提升、服务创新。

因此,我们推出了“腾讯云MaaS服务”,在腾讯云行业大模型精选商店中,我们不仅提供混元大模型,还上架了20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。

企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。

同时,我们也将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。

通过智能生产,我们以创新方式破解场景痛点。例如,在能源领域,我国有大量的电网设备,散布在偏远地区,依靠人工巡检方式,故障隐患无法及时发现和处理,影响电力生产安全。我们通过训练电力视觉大模型,一个模型可以有效适应不同电网场景,具有高检出率、低误检率、支持少样本训练、泛化能力强的优势,助力电网生产经营和减负增效。

我们通过智能营销,提升服务效率。在营销分析中,企点分析·AI助手,基于行业模型,让销售人员用自然语言提问,就可以获取准确的商业分析,几秒钟可以获取一份PPT,不再需要花费大量的时间,学习复杂的软件、制作看板。新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率,比之前提升了30%。

在上海仁济医院,我们将数智人,与医疗大模型结合,合作开发了“数智人医疗智能客服”,通过这个“虚拟护士”,患者可以用语音,无障碍咨询,看哪个科室,找哪个医生,做什么检查?系统的回复也更准确、更人性化。即保障患者高效就医,也避免了三甲医院专家资源的浪费。

同时,我们也通过智能办公,助推高效协同。现在,腾讯会议、腾讯文档、企业微信、腾讯乐享等应用,已经全面接入大语言模型能力,助力工作效率大幅提升。例如,我们的企业社区产品——腾讯乐享,拥有培训学习、知识管理、文化建设等多元能力。在腾讯内部使用过程中,沉淀了150万篇员工创作的各类技术、经营文档,每月平台浏览量超过5千万次。腾讯乐享搭载大模型能力之后,通过AI助手,可以帮助大家在复杂的资料库中,快速检索和提炼对自己有用的信息。在数字化培训中,AI还能在线进行课程答疑,一键生成测试题库,助力更有效率的企业培训。

第二,我们以“数据增强”,夯实企业数字化基石。

很多人注重大模型,但对数据关注不够。数据已经成为社会和企业运行的关键生产要素,随着智能时代的到来,数据将发挥更大作用,甚至成为企业竞争的核心壁垒。在“数据爆炸”的时代,解决好数据的处理、挖掘、安全等问题,将成为企业和开发者必须翻越的山峰。

数据处理能力有多强,决定了业务发展天花板有多高。我们持续增强数据库、大数据等能力,满足企业运行中对海量数据的存储、读写、调用和弹性管理需求。

腾讯云数据库TDSQL,单实例存储规模达到PB级别,单实例日请求次数超百亿次,在Garner报告中,OLTP(在线事务处理)及轻量级TP能力得分均为国内第一。

我们也推出AI 原生的向量数据库 Tencent Cloud VectorDB,这是国内首个从接入层、计算层、到存储层全面AI化的数据库。当你想在大模型中找到一张带“猫”的图片,腾讯云向量数据库能在1百毫秒内,从10亿张向量化的图片中,返回查询结果。

腾讯云大数据,则通过不同的大数据分析引擎和相应的数据开发、算法开发服务,帮助企业实现数据仓库、用户画像、精准推荐、风险管控等大数据应用服务。算力规模达到千万核,每天实时计算量数百万亿次,规模量级位居国内第一。我们通过云原生数据湖仓,将数据仓库的高性能和管理能力,与数据湖的灵活性融合;实现存储智能调优、无差别的数据访问体验,让存储和计算引擎无缝对接。

在数字化时代,企业的日常经营,高度依赖各种数字系统。数据需要在安全合规的情况下被使用。如果数字系统一旦被攻击,用户数据一旦被泄漏,对企业经营可能造成重大的损失,对企业信誉带来长期负面的影响,因此企业必须高度重视与投入数字安全防护能力的建设。

腾讯具备业界领先的安全能力,在威胁情报、风控反欺诈、数据安全、云安全托管服务、零信任等领域,腾讯安全多年来被权威市场分析机构,评为“领导者”和行业第一的位置,也服务了80%以上的金融行业客户、90%以上的头部能源企业、80%以上的头部车企。

广州农商行通过腾讯安全“SOC+安全运营体系”,以自动化策略拦截攻击2千万条。同时,日常威胁分析时间从原来的4小时,降到了30分钟,在有效保障系统安全同时,大幅度提升了安全运营效率。

第三,我们以“连接增强”,激发场景创新。

做好产业数字化,还需要推动数据像水一样,不断滋养人、财、物等传统生产要素,才能生长出像参天大树一样的、健康高效的企业经营管理体系。流动的水才有活力,而流动的数据才能发挥作用,“连接”就是数据保持流动的“河道”。

过去,我们通过QQ、微信等连接了超过10亿用户。今天,我们也将这样的连接,拓展到产业场景中人与人、人与物、物与物的连接。企业微信连接超1200万真实企业及组织,腾讯会议用户数超过3亿。

在产业互联网中,我们仍然致力于连接用户,把用户身份贯穿多个企业应用,过程中也发现了企业身份ID管理上的许多痛点。在企业的数字办公环境中,身份ID是员工进入业务场景的“工卡”。随着企业内网与云上的数字系统越来越多,如果不同系统各有自己的账号"门禁",多重身份ID的维护成本很高,用户无法在不同系统间自由切换,数据也打不通、不同步,给员工带来许多不便,同时割裂的权限管理也大大增加了数据安全的风险。

今天,我很高兴向各位宣布,腾讯统一身份ONE ID,正式发布。它能帮助企业统一管理员工的身份架构、登录方式、应用权限,一处管理,各处身份一致。员工用一个身份,就可以顺畅访问各业务系统。One ID不仅与腾讯会议、腾讯文档、腾讯乐享等,自研SaaS应用兼容,也将全面兼容第三方应用。One ID的统一身份能力,也可以让业务系统,自由组成松散套件,让企业客户能够自由选择最符合业务需要的应用,有更好的业务联动体验。

在全真互联的时代,我们以实时数字孪生,连接时间、空间、物体和人,基于AI、实时计算、仿真推演、大数据等技术对数据整合处理,实现物理世界在虚拟世界中可观察、可分析、可预测、可管控。

腾讯与故宫合作打造“数字孪生智慧管理平台”,不仅在线上复刻了古建筑的样貌和结构,还打通了照明、湿度、仓储、门禁等多个管理系统。可以根据丝绸、陶瓷、青铜等不同材质,自动调整灯光、温湿度、二氧化碳浓度等参数,为文物提供最适宜的环境,最大程度减少损耗。同时,对烟雾、火灾、入侵等危险情况,进行实时监测和预警,保障文物与建筑安全。

各位嘉宾,各位伙伴!

过去五年,在社会各界的共同努力下,数字科技已经深入各行各业,“上云”已经从“共识”成为“现实”。在产业互联网的征途中,我们已经开始全力攀登“智慧化”的阶梯,开创产业升级新局面。

在探索未来的道路上,我们期待,与伙伴携手,共同探索大模型等全新行业机遇,持续拓展下沉市场。我们将坚持打磨“好产品”,拥抱“被集成”,搭建“数字化大舞台”,请伙伴当好主角,唱好戏;以持续稳定的合作规则,让伙伴与腾讯的合作分工更清晰、投入更有积累、收益更可预期。

我们将立足于未来,立足于实效,让数字化工具在产业中用起来、用得好,以智能增强、数据增强、连接增强,持续助力产业增强。我们会继续以创造价值为目标,坚定地投入技术与创新,不断完善产品,提升服务体验,与生态伙伴、产业客户同心协力,共建产业智能未来!谢谢大家!

演讲2:

大家好!

欢迎来到腾讯全球数字生态大会“行业大模型与智能应用”专场,共同探讨AI驱动下的产业发展。

人工智能发展至今已经有70多年,在前几波浪潮中,AI虽然在一些产业应用中,实现了落地,但受到基础算法、算力、数据等限制,距离普遍的产业应用,还有一定距离。

大语言模型的发展,第一次让我们看到了,AI在产业中,大规模落地的可能。六个月前,很多企业惊叹于通用大模型的生成能力,迫不及待地尝试与业务结合。但很快发现,通用大模型在实际应用中,面临专业度、准确度、数据安全、成本等很多挑战。基于此,腾讯云在6月19日推出了腾讯云MaaS服务,通过“行业大模型+企业数据精调”方案,帮助产业伙伴打造适合自己的大模型产品。

三个月来,我们建设行业大模型的思路,获得了业界的普遍认可,很多企业通过我们的行业大模型,大幅提升内容生产、营销、客服能力,客户也和我们一起,挖掘出更多落地的创新应用。

技术变革和客户需求的快速发展,给行业大模型发展带来更多机遇,也推动腾讯云MaaS服务能力快速迭代,在这里,我也和大家分享一些我观察到的大模型发展趋势。

首先,行业大模型正深入各类业务场景,推动企业全链条智能化。

六个月前,客户来谈大模型,能想到的应用场景基本只是文字客服。但今天,应用场景已经快速扩展到各个领域,比如,在金融行业,大模型已经应用在开户、业务处理、风控等多个场景。

基于这些客户需求,我们尝试用大模型打造全栈产品能力,用于业务不同环节,助力企业全链条提质增效。

就拿金融行业来说,海量单据的处理是金融业务员的突出痛点,这项工作技术含量低、但又很重要,容错率低,每天都要耗费大量时间。一家国内头部商业银行找到我们,用搭载大模型能力的TI-OCR平台,只需要50张标注数据,就能识别回单、发票、申请书等多种表单,准确率超过95%,需要的数据也大大减少。不仅节约业务人员的大量时间,而且还能自动提炼核心标签,生成电子数据文件,进行后续商业分析。

而风险管理是金融业务的生命线,金融机构几个月就得升级一次风控模型,传统建模流程,耗时耗力,我们也将腾讯安全积累多年的多模态风控知识,沉淀到金融风控大模型中。金融机构通过小样本的提示,就可以根据客群和市场的变化,自动生成专属的风控模型,整个建模流程,从2周减少到2天,整体反欺诈效果提升了20%左右。

在客户服务环节,大模型的应用也不仅仅是文字对话,专属大模型与数智人的结合,让虚拟客服用拟人化的方式,与客户顺畅地实时互动;再加上基于音视频,和图像识别的人脸核身技术,就可以高效在线办理金融业务。根据行业统计,金融客服中心的运营成本中,人力成本占到60%-70%。中信建投就运用腾讯云智能的解决方案,完成了95%的新用户开户工作。

其次,随着大模型的产业落地,大家更关注如何寻找与自身业务更匹配的模型底座,训练出符合自身需求的专属模型。

这驱使我们不断升级大模型商店,提供全新的“1+N+N”服务,满足不同企业的不同需求。

“1”代表我们的腾讯混元大模型。在大会的主论坛中,我们正式公布了自研通用大模型——混元,腾讯内部多个业务和产品,已经接入测试,并取得不错的效果,更多业务和应用也正在逐步接入中。混元不仅是腾讯行业大模型的重要支撑底座,也面向行业开放。通过我们的大模型商店,客户可以利用混元,来训练自己的专属模型,并借助API开放能力,与已有业务系统无缝融合。

然后第一个“N”,是指混元之外,我们在大模型商店中,提供Llama 2、Falcon、Bloom等20多种行业最新、最流行的开源通用大模型,供客户选择。同时我们的TI平台,也已经支持这些开源模型的训练和推理。客户基于Jupyter Notebook,就可以快速启动模型精调,模型部署通过低代码操作就可以完成。

第二个“N”,指的是我们的行业大模型。在通用大模型基础上,通过行业数据再次加工,为行业客户提供更专业和精准的服务。目前我们的行业大模型,从早期的文旅、泛互、零售等领域,快速扩展到能源、消费电子、医疗等20多个行业,并覆盖生产、销售、客服等多个环节。

企业可以在大模型精选商店中,挑选合适的模型为基础,通过腾讯云智能的TI平台,导入企业独有的专业文档与企业数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,更好满足企业个性化需求。同时,不管是在公有云上搭建,还是私有化部署,我们都可以做好权限管控和数据加密,让企业用户在使用模型时更放心。

再次,模型的热潮导致硬件和人力成本攀升,更多的企业意识到,拥抱大模型不能只是一时冲动,还要理性考虑落地成本,训练、推理的效率。

企业专属模型的生成,涉及到数字资产资源管理、数据标注、训练、评估、测试和部署等很多环节。同时,根据业务发展,企业模型需要不断地调优、迭代,数据处理的整个过程,也要不断地重复。

如何帮助企业高效率、低成本地用好模型?我们通过基于腾讯云TI平台的行业大模型精调解决方案,帮助模型开发者与算法工程师,一站式解决数据处理问题,保障数据高质高效、安全合规地处理;通过多机多卡训练加速能力,高效率、低成本地创建和使用大模型。

这次,我们对TI平台的工具链进行了全新升级,全新升级的太极Angel框架,通过异步调度优化、显存优化、计算优化等方式,让大模型的训练速度提升30%,推理加速比达到了2倍。

行业大模型正在走进千行百业,大量新的场景、新的需求被激活,如何低成本获取底层算力,也是企业当前面临的突出难题。在大模型的底层基础设施上,我们对服务器、网络、数据这个“铁三角”不断优化,帮助客户降本增效。

我们的新一代HCC高性能计算集群,实现了GPU算力无损释放,服务协议等级(SLA)不低于99.9%。同时基于云原生架构,实现训练和推理业务的混合部署,大量节约大模型的部署、训练成本。

我们自研的服务器机间网络——星脉,做到了业界最强的3.2T带宽、支持10万卡集群组网,让GPU之间的通信更快,拥堵更少,计算效率更高。

我们也在国内云厂商中,率先推出向量数据库,提升海量非结构化数据的存储和检索效率,让大模型预训练数据的分类、去重和清洗,实现10倍的效率提升。1个月左右的数据接入时间,3天即可完成,极大降低了企业的成本。

毫无疑问,我们正在迈入被人工智能剧烈改变的时代,AI将通过与产业深度融合,创造更大的价值。腾讯将不断开放自身的技术和能力,助力产业拥抱智能升级,实现更高质量的发展。

加载中...