新浪财经

中信建投 | AIGC应用系列 (四):重塑交互体验,看好虚拟人、教育

中信建投证券

关注

重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称“中信建投”)客户中符合《证券期货投资者适当性管理办法》规定的机构类专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非中信建投客户中的机构类专业投资者,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!

|杨艾莉

多模态提升交互体验,多种内容输出形式有望推动虚拟人和教育场景落地。海外Midjourney、Runway推出或升级视频AIGC产品,以及阿里达摩院近期上线文本生成视频大模型,我们可以看到AIGC技术在应用端正快速发展。从此前情感陪伴聊天机器人Glow展示了文本的单模态模型和应用,到现在已见语音、图片、视频等多种形式的内容输出,我们预计将加速虚拟人和教育领域的落地。

在虚拟人和教育产业链,从海外来看,我们梳理全球头部创投公司Y Combinator在2023年投资孵化的30余个AI项目及其他AI公司,包括:Glow(情感陪伴聊天机器人)、Iliad(3D建模)、Decoherence(基于文字与音乐生成视频)、Fabius(AI培训工具)、Tennr(AI提词器)、Texel(AI模型和视频处理的加速器)等。

走向多模态,从“数字人”到“数智人”

多模态升级交互体验,实现“数字人”向“数智人”转变。单模态以情感陪伴聊天机器人Glow为代表的“数字人”为例,其已经可以实现与真人的个性化、拟人化、智能化的聊天互动,但交互方式仍局限在文本、语音。未来,随着多模态模型的发展,虚拟人或机器人的交互方式,有望拓展至图片、音乐乃至视频,并以更贴近真人的逻辑、理解、表达能力进行交流和反馈,从而提升虚拟人在电商、直播、教育、客服、社交、文旅导览等领域的互动体验。

AI模型与应用向多模态升级迭代。Vision Transformer模型、扩散模型、BEiT模型等技术的迭代,实现了传统单模态大模型中自然语言处理能力与计算机视觉能力的结合,以及大规模自监督预训练,由此使得大模型具备了理解、处理和生成图片、音视频等多模态的能力,催生了Open AI GPT-4、谷歌PaLM-E、百度文心一言等多模态大模型。多模态模型也带动了多模态应用的诞生,涉及代码生成、文本生成、图像生成、音视频、游戏、虚拟人等领域。

全球知名创投YC,前瞻性投资30+AI应用项目

Y Combinator成立于2005年,为美国知名创业孵化公司,在胡润研究院发布的《2021全球独角兽投资机构百强榜》中,位列第12位。据福布斯中国,YC目前已资助公司超3500家,包括80家独角兽公司,例如Dropbox、Airbnb、Reddit等

YC最新投资项目涉及生成式AI在生产力提效、交互场景、开发者相关领域应用。YC每年推出2期孵化计划,即Winter Batch 和 Summer Batch ,由全球申请者中筛选出的具有发展潜力的公司组成。YC将为入选项目提供50万美元种子轮融资、创业建议以及业内资源。在23年初Winter Batch的210个项目中,有36个生成式AI项目,应用场景涵盖市场营销、客户服务、知识管理、数据分析、基础设施、开发者工具等。

虚拟人:摆脱“套皮”,解决“伪需求”问题

开发平台、交互、算力优化等虚拟人产业链布局解决需求问题,推动行业发展。通过梳理AIGC应用落地场景,我们已看到虚拟人产业链已有智能开发平台、交互升级、算法优化等方面的布局。随着AIGC技术加深与虚拟人产业链的融合,预计有望降低虚拟人开发成本、解决“套皮”问题、交互不拟人等,从而推动虚拟人的落地和发展。

1)虚拟人开发成本:结合AIGC的元宇宙内容开发平台,解决数字内容开发成本高、效率低的困境。

2)解决“套皮”问题:随着多模态模型的推出,有望实现文本/语音、视频/模型等多内容模式的AI智能化产出,从而摆脱真人套皮问题。

3)加速器减轻设备压力:语音和视觉结合的AI生成对设备需要较高,而相关算法的优化有助降低运营成本压力,实现更大规模的普及。

教育:AI辅助教学+虚拟人教学双线推动场景落地

我们认为教育场景的AIGC技术落地,将主要有两种模式:

1)AI辅助真人教学:在海外的AIGC应用场景中,我们看到在销售场景,已有多种辅助工具落地,包括AI提词器、AI素材生产等,预计这些场景的AI融合有助真人教学统一或升级教学质量,多样化教学形式,也更有利于在线教育平台在降本的同时,维持商业化的能力。

2)虚拟人教学:随着文字/语音输出的内容更加拟人,且多模态模型优化了虚拟人动作、表情僵硬等问题,虚拟人也有望落地教育场景。尤其对早教而言,交互体验升级也有望实现教学质量的统一和提升。

生成式AI技术发展不及预期;算力支持程度不及预期;数据质量及数量支持程度不及预期;用户需求不及预期;技术垄断风险;原始训练数据存在偏见风险;算法偏见与歧视风险;算法鲁棒性风险算法透明度风险;增加监管难度风险;政策监管风险;商业化能力不及预期;相关法律法规完善不及预期;版权归属风险;深度造假风险;人权道德风险;影响互联网内容生态健康安全风险;企业风险识别与治理能力不足风险;用户审美取向发生变化的风险。

证券研究报告名称:《AIGC应用系列 (四):重塑交互体验,看好虚拟人、教育》

对外发布时间:2023年3月24日 

报告发布机构:中信建投证券股份有限公司 

本报告分析师: 

杨艾莉 SAC编号:S1440519060002

SFC编号:BQI330

加载中...