【光大海外&互联网】谷歌正式发布Gemini，应用端和硬件端积极布局

EBoversea

2023.12.0807:00

关注

报告标题：《谷歌正式发布Gemini，应用端和硬件端积极布局——AIGC行业跟踪报告（三十八）》

报告发布日期：2023年12月7日

分析师：付天姿，CFA，FRM（执业证书编号：S0930517040002）

联系人：赵越、杨朋沛

事件：美国东部时间2023年12月6日，谷歌发布了Gemini 1.0大模型，性能对标GPT-3.5的Gemini Pro已可在Bard中体验，12月13日开发人员和企业客户可通过GoogleAI Studio和Vertex AI的Gemini API访问Gemini Pro，预计将于24年初推出由Gemini Ultra提供支持的Bard Advanced。

Gemini实现多模态能力，是迄今为止谷歌推出的最通用、最灵活的大模型。Gemini可以在数据中心、谷歌云、移动端等设备和平台高效运行，赋能Bard、Pixel等多款产品。Gemini1.0包含三种不同版本：1）GeminiUltra：体量最大、性能最强的版本，可以完成高度复杂任务；2）Gemini Pro：适用于各种扩展任务的模型。3）Gemini Nano：适用于端侧设备的高效模型。

Gemini在性能测试中展现出全方位的性能升级。

1）自然图像、音频、视频理解和数学推理性能测试：GeminiUltra在MMLU（数学、物理、历史等57门学科知识和解决问题能力）中的得分为90.0%（GPT-4为86.4%），是第一个在MMLU方面优于人类专家的模型；

2）编码能力和数学能力：GeminiUltra 在多个编码基准测试中表现出色，包括用于评估编码任务性能的行业标准HumanEval和谷歌内部数据集Natural2Code；同时在基础性和挑战性数学测试中获得了高分。

3）Gemini Ultra日常任务推理中得分明显低于GPT-4。

通过Duet AI工具集，Gemini等底层技术进步可以较快地传导至应用端。谷歌推出AIGC驱动的工具集Duet AI，包括代码助手、聊天机器人助手、AI搜索等功能，与谷歌旗下产品生态有机结合：

1）Duet AI for Google Cloud：通过Vertex AI协助开发者更高效地开发应用。

2）Duet AI for Workspace：提供AI驱动的内容生成编辑、数据可视化等功能，赋能办公体验。

3）除Duet AI外，Gemini可用于搜索引擎、广告、Chrome浏览器等产品中。根据谷歌官方测试，Gemini明显提升了AI驱动的搜索生成体验（SGE）的速度，用户在美国运用英语搜索的延迟减少了40%，同时提高了检索质量。

Gemini与谷歌在AI设备端和硬件的布局相辅相成。

1）23M10推出的Pixel 8新机内置Google AI基础模型。搭载专为Google AI定制的Tensor G3芯片。

2）与Gemini同步发布Cloud TPU v5p。Gemini基于谷歌自研TPU v4和v5e架构训练，定制设计的AI加速器更加高效。

3）推出设备端专用的轻量级Gemini Nano。GeminiNano-1和Nano-2的参数仅达到18亿和32.5亿，但在事实性任务、推理、多模态、多语种等任务上表现出了较优秀的性能。

投资建议：DALL·E 3与GPTs实现丰富的应用场景，Pika 1.0在AI视频领域进步显著，多模态大模型技术发展有望进一步推动多媒体领域AIGC应用涌现。

短期来看，AI图文生成距离成熟的商业化产品仍有差距，建议关注以下机会：1）广告营销、自媒体等对视频质量要求不高领域；2）数字人直播等定制化空间小的模式。关注万兴科技、科大讯飞、蓝色光标、遥望科技。

中长期来看，AI降低内容创作壁垒，版权资源、创作经验仍是AI多媒体领域的核心竞争力，建议关注：

1）北京文化：公司是《流浪地球》系列电影出品方，而pika和郭帆合作了《流浪地球3》，为G!lab电影工业化实验室的战略合作伙伴；

2）拥有影视版权库的公司：捷成股份、华策影视；

3）动画电影公司：奥飞娱乐、上海电影、光线传媒、百纳千成；

4）布局AI视频/图片产品的公司：万兴科技、易点天下、美图公司。

风险提示：AI技术研发和产品迭代不及预期；AI降低门槛后内容创作竞争加剧风险；多模态大模型商业化进展不及预期风险；AI内容生成版权政策风险。

免责声明