新浪科技

【银河计算机吴砚靖】海外科技双周报丨AIGC持续突破,Gemini 1.5 Pro、OpenAI Sora引爆AI视频生成赛道

财经自媒体

关注

【报告导读】

[2月2日-2月16日|美东] 双周动态

1. 过去两周,美股、港股及台股全线上涨。

2. 热门科技股大部分上涨。

3. 美国10年期国债利率上涨至4.30%,累计上浮27bps;截至2月9日,美元兑人民币中间价报7.10,上周累计调贬30个基点。

4. 铿腾电子、ARM、亚马逊及高通披露季报。

5. 谷歌Gemini 1.5 Pro、OpenAI Sora、Meta V-JEPA先后发布。

6. 2月2日至16日,ARM.O累计涨幅达80.76%,总市值升至1319.43亿美元。

2月15日谷歌发布Gemini 1.5 Pro,上下文窗口容量扩展至100万个tokens。据Medium,Gemini 1.5 Pro参数量为175B,相比于上一代Gemini Pro参数量600B显著降低。Gemini 1.5 Pro的参数效率提升,可减少对LLM微调及知识注入的需要。预计模型训练将产生协同效应,进行大规模模型推理时,微调成本有望大幅降低。两大海外巨头加码AI视频赛道:OpenAI发布可实现文生视频的生成式AI模型Sora,目前Sora可完成最长约60S的文生视频,效果惊艳;Meta紧随其后发布非生成视频模型V-JEPA,迈向AMI(先进机器智能)愿景的下一步。

我们认为,在AIGC领域,难度排序由易到难依次是文本、图像、音频、视频Gemini 1.5 pro以及Sora发布标志着AGI时代正加速到来,二者均在“文生视频”领域取得里程碑式突破。未来随着模型规模增大,参数将继续放大,多模态大模型陆续推出将引发对算力需求的指数级提升,包括训练和推理,并且在影视制作、游戏开发、教育培训、广告及社交等场景应用也将带来颠覆式革命。

海外季度财报总结

铿腾电子2023年业绩实现增长,2024Q1指引未及预期】

铿腾电子(CADENCE)于2月12日发布2023Q4及2023FY业绩报告。从全年来看,2023财年营收为40.90亿美元,同比增长14.83%;净收益为10.41亿美元,相比2022年的8.49亿美元,同比增长22.64;总成本为28.39亿美元,同比增长14.10%;研发费用为14.42亿美元,同比增长15.20%;单季度GAAP摊薄每股收益为3.82美元,相比2022年的3.09美元,同比增长23.62%。

公司2023Q4单季度实现总营收10.69亿美元,同比增长18.75%,环比增长10.64%;净收益为3.24亿美元,同比增长40.59%,环比增长27.36%;总成本为7.32亿美元,同比增长6.29%,环比增长0.26%;研发费用方面,本季度的研发费用为3.67亿美元,环比降低0.59%,同比增长4.86%;单季度GAAP摊薄每股收益为1.19美元,同比增长35.23%,环比增长27.96%。

细分收入方面,产品及维护业务收入为9.82亿美元,占总收入的91.89%,同比增长16.09%,环比增长1.67%,服务业务收入为0.87亿美元,占总收入的8.11%,相比2022Q4的0.54亿美元,增长了60.45%,环比增长了51.32%。

AI方面,本年度通过引入用于智能功耗分析的Voltus™InsightAI和用于人工智能驱动的全系统热分析的摄氏度™Studio,进一步扩大了Cadence.AI生成式人工智能产品组合。Cadence.AI产品组合的加速发展使采用GenAI解决方案的客户数量在2023年增加了近十倍。2月早些时候发布的Millennium™企业多物理场平台是业界首个结合AI、HPC和数字孪生技术的硬件/软件平台,可实现20倍的能源效率和高达100倍的设计影响。

业绩展望方面,对于2024年的第一季度,公司预计收入在9.9亿美元至10.1亿美元之间,未及预期;GAAP营业利润率为24.5%至25.5%;非GAAP营业利润率为36.5%至37.5%;GAAP摊薄每股收益在0.74美元至0.78美元之间。对于2024财年,公司预计收入在45.5亿美元至46.1亿美元之间;GAAP营业利润率在32%至33%之间;非GAAP营业利润率为42%至43%;GAAP摊薄每股收益为4.08美元至4.18美元。

【Arm 2024 Q3业绩超预期,全年利润预期大幅上调】

Arm于2月7日披露公司2024财年第三财季业绩报告,公司单季度实现总营收8.24亿美元,同比增长13.81%,环比增长2.23%;相比于此前分析师预期的7.60亿美元,超市场预期。这一增长是由于创纪录的特许权使用费及许可证收入所致;毛利润为7.88亿美元,同比增长13.38%,环比增长3.68%;总成本为6.54亿美元,同比增长45.01%,环比下降28.6%;单季度GAAP摊薄每股收益为0.08美元,同比降低55.56%,环比增长172.73%。

细分收入方面,许可证及其他(License and other revenue)收入达3.54亿美元,同比增长18%,环比下降8.76%,同比增长归因于各终端市场的公司增加对更先进Arm CPU的投资需求强劲,尤其在AI领域。截至2023年12月31日的九个月与去年同期相比,增加2.72亿美元,主要系新的许可协议、前期安排的收入增加,以及客户更新现有的许可证,以获得最新版本的技术IP。特许权使用费(Royalty revenue)收入为4.7亿美元,同比增长10.59%,环比增长12.44%,得益于半导体行业的复苏和基于Armv9的芯片的迅速增加渗透,这类芯片通常能够获得更高的费率。截至2023年12月31日的九个月特许权使用费收入与去年同期相比,减少了1300万美元,主要原因是宏观经济放缓,以及整个供应链库存水平降低导致客户出货量减少。

研发费用方面,本季度的研发费用为4.32亿美元,同比增长51.05%,环比降低30.99%;同比的增长由工程人员增长20%所导致,部分增长被基于股份的薪酬成本的变化所抵消。

AI方面,具最前沿技术的AI应用程序如今可在Arm上运行,例如NVIDIA最近宣布数十个新的AI超级计算机正在上线,它们整合了基于Arm的GH200 Grace Hopper Superchip。另外,Dell Technologies、惠普、联想、Quanta和Supermicro等企业正在使用GH200来解决一些最具挑战性的问题。边缘AI方面,谷歌最近透露了他们的LLM,Gemini Nano,运行在最新的基于Arm的Pixel 8智能手机上,而三星、Vivo和小米都宣布了展示生成式AI和LLM能力的新的基于Arm的智能手机。一些功能包括实时通话翻译、直观的搜索功能,如圈选搜索,以及高级的照片和视频功能。随着越来越多的应用转向AI,Arm也正在投资于软件生态系统,以将AI应用于数十亿基于Arm的设备上。一个关键解决方案是AI引擎ArmNN,,它与最广泛使用的AI框架无缝集成,并使开发者能够为移动和消费电子设备创建AI应用。自2018年推出以来,ArmNN已经部署在超过7亿台设备上,为AI应用无缝移植至现有产品提供新方式。

财报电话会议指出,公司2024Q4财季业绩预期目标为8.5亿至9亿美元,中间值为8.75亿美元;与先前隐含指引相比,增加9500多万美元。因第三季度业绩的强劲表现,公司全年业绩预期上调,全年收入指引将上升至31.55亿美元至32.05亿美元,相比调整前增加1.6亿美元。

【亚马逊下季度业绩预期上调,AI推动AWS保持增长】

亚马逊于2月1日发布2023Q4及2023FY业绩报告。第四季度来看,公司单季度实现总营收132.09亿美元,同比增长382.61%,环比增长18.06%。净收益为106.24亿美元,同比增长3721.58%,环比增长7.54%;总成本为1567.52亿美元,同比增长了7.02%,环比增长18.85%;单季度GAAP摊薄每股收益为1.00美元,相比去年同期增加0.97美元,环比增长6.38%。净销售额为1699.61亿美元,同比增长13.91%,环比增长18.78%。分地区来看,北美部门营业收入为64.61亿美元,占总营收48.91%,收入同比增长2792.08%,环比增长50.01%;国际部门运营亏损了4.19亿美元,同比增长81.19%,而环比下降341.05%。AWS部门的营业收入为72亿美元,占总营收54.26%,同比增长37.69%,环比增长2.74%。

全年来看,2023财年公司实现总营收为368.52亿美元,同比增长200.88%;净收益为304.25亿美元,相比2022财年亏损了27.22亿美元,同比增长1217.74%;总成本为5379.33亿美元,同比增长了7.21%;净销售额为5747.85亿美元,同比增长11.83%;GAAP摊薄每股收益为2.9美元,相比2022财年的-0.27美元,增长了3.17美元。细分板块方面,主营业务可分为六个板块:1)线上商店净销售额为2318.72亿美元,同比增长5.39%;2)线下商店净销售额为200.3亿美元,同比增长5.63%;3)三方卖方服务净销售额为1400.53亿美元,同比增长18.98%;4)广告服务净销售额为469.06亿美元,同比增长24.29%;5)订购服务净销售额为402.09亿美元,同比增长14.17%;6)AWS云服务净销售额为907.57亿美元,同比增长13.31%。分地区来看,北美分部营业收入为149亿美元,而2022年营业亏损为28亿美元。国际部门运营亏损为27亿美元,相比 2022年运营亏损有所收窄。AWS部门的营业收入为246亿美元,相比2022年的228亿美元略增长。

现金流方面,当前年度现金流表现强劲,运营现金流增长了82%,达到849亿美元,同比增长81.41%;本年度的自由现金流流入改善为368亿美元,同比增长217.24%。

AI方面,本年度举办了第12届AWS re:Invent大会,吸引了超过50,000名现场与会者和超过300,000名虚拟与会者,AWS宣布了新技术和功能,可帮助各种规模的客户利用生成式AI、提高生产力并增强安全状况。其中,公司发布了Amazon Q机器人,它编写代码、调试代码、测试代码以及进行翻译,它还可以查询AWS客户的各种数据存储库来回答问题、汇总数据、继续进行对话,然后采取行动。公司还扩大了Amazon Bedrock的模型选择并增加了新功能,Amazon Bedrock是AWS的完全托管服务,可利用现有的大型语言模型(LLM)并使用自己的数据对其进行自定义。借助Bedrock,AWS还提供了来自领先AI公司的高性能FM选择,并添加了来自Anthropic、Cohere、Meta、Stability AI的最新模型以及自己的Amazon Titan FM系列,扩大了客户对行业领先模型的选择范围支持各种用例。公司发布的Amazon SageMaker中的新功能可加速构建、训练和部署LLM和其他FM。发布的Amazon SageMaker HyperPod可通过为大规模分布式训练提供专用基础设施,将训练FM的时间缩短高达40%。发布的Amazon SageMaker Inference可通过优化加速器的使用,将FM部署成本平均降低50%,将延迟平均降低20%。发布的AWS Trainium2芯片,与第一代AWS Trainium芯片相比,可为生成式AI应用程序提供高达四倍的ML训练速度和三倍的内存容量。AWS和NVIDIA还扩大了合作,提供最先进的基础设施、软件和服务,为客户的生成式AI创新提供支持。NVIDIA和AWS还在Ceiba项目上进行合作,设计世界上最快的GPU驱动的AI超级计算机,由AWS为NVIDIA自己的研发团队托管。

业绩展望方面,公司预计2024年第一季度净销售额将在1,380亿美元至1,435亿美元之间,同比增长8%至13%;单季度营业收入预计在80亿至120亿美元之间。由于从2024年1月1日开始,亚马逊服务器的预计使用寿命增加,因此折旧费用预计将减少约9亿美元。

海外主要股指周变动

股指动态:过去两周,美股、港股及台股全线上涨。标普500指数合计上涨0. 95%,纳斯达克综合指数上涨0.94%,TAMAMA科技指数上涨0.34%;费城半导体指数上涨4.40%;纳斯达克中国金龙指数上涨9.74%;恒生科技指数上涨9.82%。

美股科技:热门科技股大部分上涨。据统计,相比2月2日收盘价,2月16日盘后,苹果下跌1.78%,英伟达上涨9.75%,特斯拉上涨6.41%,谷歌下跌4.18%,亚马逊下跌1.31%,META下跌 0.35%,微软下跌1.56%,ARM上涨80.76%,英特尔上涨2.44%,高通上涨7.76%,AMD下跌2.13%。

*2月2日至16日,ARM.O累计涨幅达80.76%,总市值由727.92亿美元升至1319.43亿美元,主要系2024Q3财季业绩超预期增长,全年业绩预期上调所致。

美债及汇率情况

过去两周,美国10年期国债利率由4.03%上涨至4.30%,累计上浮27bps;上周,中国10年期国债利率由2.42%上涨至2.43%,累计上浮0.58bps。

2月9日,美元兑人民币中间价报7.10;较2月2日价7.10,累计调贬30个基点。

本周热点事件

【谷歌推出人工智能模型Gemini 1.5 Pro】

自推出Gemini 1.0以来,谷歌一直在测试、完善和增强其功能。2月15日,谷歌宣布推出下一代型号:Gemini 1.5 Pro。Gemini 1.5 Pro显着增强了性能。它代表了谷歌方法的重大改变,建立在几乎谷歌所有基础模型开发和基础设施的研究和工程创新之上。Gemini 1.5 Pro建立在对 Transformer 和 MoE架构的领先研究之上:传统Transformer是一个大型神经网络,而MoE模型则被划分为更小的“专家”神经网络,可使Gemini 1.5的训练和服务更加高效。谷歌发布用于早期测试的第一个Gemini 1.5型号是Gemini 1.5 Pro:中等大小的多模态模型,针对跨广泛任务的扩展进行了优化,并且与谷歌迄今为止最大的模型1.0 Ultra的性能相当。它还引入了一个在长上下文理解方面的突破性实验功能。Gemini 1.5 Pro上下文窗口容量增至100万个tokens,意味着可以一次性处理大量信息,包括1小时的视频、11小时的音频、超过 30,000行代码或超过700,000个单词的代码库。研究中谷歌成功测试了多达1000 万个tokens。从今天开始,少数开发人员和企业客户可以通过AI Studio和Vertex AI的私人预览版在最多100万个tokens上下文窗口中进行尝试。

【OpenAI发布新的生成式AI模型Sora,只需输入描述性句子即可创建逼真的视频】

2月15日,OpenAI公司周四推出了新的生成式AI模型Sora。Sora的工作原理与OpenAI的图像生成人工智能工具DALL-E类似。用户输入所需的场景文字,Sora将生成高清视频。Sora还可以生成受静止图像启发的视频,并扩展现有视频或填充缺失的帧。Sora目前仅限于生成一分钟或更短的视频。OpenAI,由微软支持,将多模态(文本、图像和视频生成的结合)作为提供更广泛的人工智能模型套件的目标。目前,Sora只对一小群安全测试人员或“red teamers”开放,他们测试模型在错误信息和偏见等领域的脆弱性。该公司尚未发布除其网站上的 10 个样本剪辑之外的任何公开演示,并表示其随附的技术论文将在2月15日晚些时候发布。与GPT模型类似,Sora使用Transformer架构,解锁卓越的缩放性能。视频和图像使用patch(视觉编码块)的较小数据单元的集合,每个patch都类似于GPT中的令牌。通过统一表示数据的方式,可在比以前更广泛的视觉数据上训练扩散Transformer,跨越不同的持续时间、分辨率和长宽比。Sora建立在过去对DALL-E和GPT模型的研究基础上。它使用来自DALL-E3的重捕获技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此,该模型能够更忠实地遵循用户在生成的视频中的文字指令。除了能够仅从文本指令生成视频外,该模型还能够获取现有的静止图像并从中生成视频,并精确地将图像内容动画化,并关注小细节。该模型还可以获取现有的视频并对其进行扩展或填充缺失的帧。Sora是能够理解和模拟现实世界的模型的基础,这一能力将是实现AGI的重要里程碑。

【Meta发布V-JEPA,迈向AMI愿景的下一步】

2月15日,Meta公开发布关于联合嵌入预测架构(V-JEPA)模型的视频,此物理世界模型的早期示例擅长检测和理解对象之间高度详细的交互。本着负责任的开放科学的精神,Meta在知识共享非商业许可下发布此模型,供研究人员进一步探索。V-JEPA是一种非生成模型,通过预测抽象表示空间中视频的缺失或屏蔽部分来进行学习。这与Meta的图像联合嵌入预测架构(I-JEPA)比较图像的抽象表示(而不是比较像素本身)的方式相似。与尝试填充每个缺失像素的生成方法不同,V-JEPA可以灵活地丢弃不可预测的信息,从而将训练和样本效率提高1.5至6倍。由于V-JEPA采用自我监督的学习方法,因此完全使用未标记的数据进行预训练。标签仅用于在预训练后使模型适应特定任务。事实证明,这种类型的架构比以前的模型更有效,无论是在所需的标记示例数量方面还是在学习未标记数据方面投入的总工作量方面。借助V-JEPA,Meta在这两个方面都看到了效率的提升。V-JEPA本质是一种预测分析模型,完全从视觉媒体中学习。它不仅可以理解视频中发生的事情,还可以预测接下来会发生什么。公司称训练使用了一种新的掩蔽技术,其中部分视频片段在时间和空间上被掩蔽,这意味着即使视频中的某些帧被完全删除,模型仍可预测当前帧和下一帧。值得注意的是,该模型可以预测和分析长达10秒的视频。目前,V-JEPA模型仅使用视觉数据,这意味着视频不包含任何音频输入。Meta目前正计划在ML模型中将音频与视频相结合,另一目标则是提高其在较长视频中的能力。

【英伟达公开展示超级计算机Eos】

英伟达在2月15日发布了一段视频,首次公开展示其最新的数据中心规模超级计算机Eos,为人们提供了一窥高级AI工厂背后架构的机会。Eos是一种超大型NVIDIA DGX SuperPOD,NVIDIA开发人员利用加速计算基础设施和全面优化的软件实现AI突破。Eos配备了576套NVIDIA DGX H100系统、NVIDIA Quantum-2 InfiniBand网络和软件,提供总共18.4 exaflops的FP8 AI性能。Eos在2023年的超级计算贸易展览会上公布,以希腊女神的名字命名,这位女神据说每天打开黎明的大门,这反映了NVIDIA对推进AI技术的承诺。Eos超级计算机每个DGX H100系统均配备八个NVIDIA H100 Tensor Core GPU。Eos总共配备了4,608个H100 GPU。因此,Eos可以处理最大的人工智能工作负载,以训练大型语言模型、推荐系统、量子模拟等。它展示了NVIDIA技术在大规模应用时的能力。Eos的到来恰逢其时,人们正在利用生成式人工智能改变世界,从药物发现到聊天机器人,再到自主机器等等。Eos在全球最快超级计算机TOP500排行榜中排名第9,突破了人工智能技术和基础设施的界限。它包括NVIDIA先进的加速计算和网络,以及NVIDIA Base Command和NVIDIA AI Enterprise等先进的软件产品。

【AMD推出嵌入式+架构;将嵌入式处理器与自适应 SoC 相结合,加快边缘 AI 应用的上市时间】

2月6日,AMD宣布推出AMD Embedded+,这是一种新的架构解决方案,将AMD Ryzen Embedded处理器与Versal自适应SoC集成到单一的集成板上,为原始设计制造商(ODM)合作伙伴提供可扩展且能效高的解决方案,加速产品上市时间。经AMD验证,Embedded+集成计算平台可帮助ODM客户减少资格认证和构建时间,从而加快上市时间,而无需花费额外的硬件和研发资源。使用Embedded+架构的ODM集成使得能够使用通用软件平台开发具有低功耗、小型化和长生命周期的设计,适用于医疗、工业和汽车应用。在同类产品中,Embedded+架构首次将领先的AMD x86计算与集成显卡和可编程硬件相结合,适用于关键的AI推理和传感器融合应用。自适应计算在确定性、低延迟处理方面表现出色,而人工智能引擎则提高了每瓦特的高性能推理能力。Ryzen Embedded处理器包含高性能的“Zen”核心和Radeon显卡,还提供世界一流的渲染和显示选项,以提升4K多媒体体验,以及用于4K H.264/H.265编码解码的内置视频编解码器。低延迟处理和高性能每瓦推理相结合,可实现关键任务的高性能,包括将自适应计算与灵活的I/O、用于推理的AI引擎和AMD Radeon显卡实时集成在一个解决方案中,该解决方案利用每种技术的最佳方面。

AI技术研发不及预期风险;巨头竞争加剧风险;法律监管风险;供应链风险;消费需求不及预期风险。

本文摘自:中国银河证券2024年2月19日发布的研究报告《【银河计算机】海外科技双周报_海外AIGC持续突破,Gemini 1.5 Pro、OpenAI Sora引爆AI视频生成赛道》

分析师:吴砚靖

评级体系:

评级标准为报告发布日后的6到12个月行业指数(或公司股价)相对市场表现,其中:A股市场以沪深300指数为基准,新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准,北交所市场以北证50指数为基准,香港市场以摩根士丹利中国指数为基准。

推荐:相对基准指数涨幅10%以上。

中性:相对基准指数涨幅在-5%~10%之间。

回避:相对基准指数跌幅5%以上。

推荐:相对基准指数涨幅20%以上。

谨慎推荐:相对基准指数涨幅在5%~20%之间。

中性:相对基准指数涨幅在-5%~5%之间。

回避:相对基准指数跌幅5%以上。

加载中...