新浪科技

AI手机行业专题报告:AI手机走向AIOS,系统级AI定位端侧智能助理

市场资讯 2024.07.07 07:01

(报告出品方/作者:国泰君安证券,舒迪、文紫妍、陈豪杰)

1. 云端协同是 AI 手机未来,端侧 AI 成本、隐私安 全多方面占优

AI 手机是基于大模型的高智能化手机终端。根据 IDC 定义,AI 手机是 NPU 算力大于 30 TOPS(INT8)、搭载支持生成式 AI 的 SoC 并支持端 侧大模型的手机。《AI 手机白皮书》认为基于大模型的 AI 手机需具备强 大的计算能力、复杂信息感知能力、自学习能力与创作能力。通过重构 手机现有服务生态与操作系统,赋予用户全新 AI 体验。 云端大模型协同满足 AI 手机不同场景需求。云侧:(1)具备高算力, 适宜进行模型训练。可支持参数量千亿以上的大模型,推理与多模态交 互能力强;(2)知识储备丰富,如 GPT-4-Turbo 外部文档和数据库截止 日期更新至 2023 年 4 月;(3)泛化能力强,可作为 AI 应用开发基座。 端侧:(1)成本低,避免数据中心高昂的运营、网络传输、能耗成本; (2)隐私安全性高,用户隐私信息存储及处理均在终端进行;(3)低 延时,仅为单一用户服务,避免需求高峰时任务处理拥挤;(4)支持离 线使用。基于云侧及端侧大模型特点,我们认为云侧大模型适用于复杂 度高、专业性强、涉及多模态交互的任务处理,端侧大模型适用于复杂 度低、隐私敏感度高的任务以及离线任务处理。针对复杂度高且涉及用 户隐私的复合任务场景,可首先在端侧进行信息脱敏,再上传至云侧进 行处理;并且端侧大模型可通过学习用户个人信息,在复杂任务处理中 给予云侧大模型更佳提示,赋予用户更佳服务体验。基于云侧、端侧大 模型协同的 AI 手机可满足用户不同场景需求,更高效地利用资源并提 供更佳服务体验。

端侧模型推理成本是云侧模型 1/100 以下。根据高通《混合 AI 是 AI 未 来》,生成式 AI 单次搜索查询成本是传统搜索方法的 10 倍,目前每天 搜索查询次数超过 100 亿次,每年增量成本可能达到数十亿美元。并且 由于大模型的推理成本与终端用户数量正相关,云侧大模型推理成本将 伴随日活用户数量及使用频率快速增长,规模化拓展难以持续。根据面 壁智能 CEO 李大海测算,以搭载骁龙 855 的 OPPO 手机为例,假定搭 载参数量 2B、每秒处理量 7.5 Tokens 的 MiniCPM 端侧模型,运行 5 年 后报废,推理成本约为 600 元,测算可得 170 万 Tokens 推理成本仅 1 元,是 Mistral 的 1/100,GPT-4 的 1/360。根据 OpenAI,其在 5 月 13 日最新发布的 GPT-4o 可免费向用户提供服务,但仍在用量方面进行限 制。根据 OpenAI Developer Forum,免费用户在 3 小时内仅允许向 ChatGPT 发送 40 条以内的消息。 ChatGPT 能耗达 50 万千瓦时/天,终端部署大模型降低数据传输能耗。 根据纽约客报道,ChatGPT 每天需处理约 2 亿个用户请求,消耗超过 50 万千瓦时电力,相当于 1.7 万个美国家庭平均一天的用电量。根据《混 合 AI 是 AI 未来》,手机终端能够以很低的能耗运行生成式 AI 模型,可 有效避免数据传输至云服务器中导致的高能耗。

端侧 AI 保障用户隐私安全,并可基于用户信息提供个性化服务。生成 式 AI 由于交互方式革新,不仅可收集用户邮箱、手机号等可唯一标识 个人的信息,也会收集用户语音聊天记录,一旦泄露会严重影响用户的 个人隐私安全。2023 年 3 月 ChatGPT 的 API 出现错误,导致 Redis 内存 中的数据并未及时清除,用户的聊天记录片段,甚至信用卡的最后四位 数字、到期日期、姓名、电子邮件地址和付款地址等信息可能泄露至其 他 ChatGPT 使用者。根据 OpenAI 官方调查报告,约有 1.2%的 ChatGPT Plus 用户面临数据泄露。与云侧 AI 相比,端侧 AI 模型将用户个人信息 储存在本地,无需上传至云服务器中,并且手机终端可通过安全芯片或 操作系统进一步保护用户信息安全。同时端侧 AI 可在不牺牲用户隐私 安全的前提下,利用储存在终端的用户信息以及用户的表情、喜好和个 性等进行学习和演进,增强和打造定制化的生成式 AI 提示,提供更个性化的服务体验。 高推理需求可导致云侧模型宕机,端侧模型可靠性好且延时低。生成式 AI 查询对云侧模型需求达到高峰时可能会出现高时延甚至拒绝服务。 2023 年 11 月 ChatGPT 更新导致用户需求火爆,ChatGPT 及其 API 出现 周期性中断,OpenAI 耗时 3 个多小时解决问题,期间收到用户 6614 份 中断报告;2024 年 3 月 20 日 Kimi 受系统流量持续异常升高影响,用户 无法正常使用。终端侧 AI 模型针对单一用户提供服务,可有效避免短 期需求大幅提升,可靠性更佳。并且端侧 AI 在无网络连接情况下仍可 正常使用,用户可随时随地享受 AI 服务体验。

2. AI 手机仍处早期阶段,AI OS 赋予完整 AI 体验

2.1. 初级 AI 手机形态:基础 AI 应用+AI 增强功能

目前 AI 手机主要是在原有操作系统上集成 AI 功能或 AI 应用。集成 AI 功能:以原有操作系统为基础,通过搭载端侧大模型增加或增强 AI 功 能,如增加 AI 助理智能摘要生成、实时翻译功能等;集成 AI 应用:通 过 OpenAI 发布的 GPT Store 下载定制化、个性化的 AI APP,如 ChatGPT APP 等,可通过自然语言交互实现旅行规划、智能问答、图像识别生成 等功能。基于生成式 AI 的美图秀秀 APP 可支持 AI 绘画、AI 修图、AI 美容等功能。基于原有操作系统的 AI 手机通过集成 AI 应用或 AI 功能, 能够以自然语言与用户进行交互并高效处理任务,但本质仍是通过 API 接口调用生成式 AI 模型,未实现 AI 系统级应用。

Galaxy AI 赋能多项应用,Galaxy S24 系列 AI 体验全面升级。Galaxy AI 首创即圈即搜功能,用户只需长按 Home 键并在当前文本、图片或视频 界面圈选图像即可获得优质结果。Galaxy S24 系列内置笔记助手,可根 据内容智能排版、生成摘要和封面;内置转录助手可识别多人讲话并转 录为支持编辑的文本,也可直接翻译录音并生成摘要;原生通话应用程 序引入通话实时翻译功能,支持 13 种语言实时双向和文本翻译;图像 应用具有智能修图建议、生成式编辑等功能,可快速去除反光、改变人 物或对象位置大小等。

谷歌 Pixel 8 系列增强图像编辑,个人助理 Gemini 智能提升。谷歌 Pixel 8 系列内置的 Magic Editor 可以通过生成式人工智能编辑照片,ZoomEnhance 通过生成式 AI 预测照片细节,填充像素间间隙,增强变焦;个 人助理 Gemini 支持文本、语音及图片交互,可帮助朗读和翻译网页并 生成摘要;录音机增加 AI 功能,可自动总结对话并生成摘要;Audio Magic Eraser 通过 AI 识别声音,可直接从视频删除不想要声音。 HarmonyOS 4 率先接入 AI 大模型,小艺同学增加多项 AI 功能。 HarmonyOS 4 采用全新华为方舟引擎,与 HarmonyOS 3 相比,滑动流畅 性提升约 20%,续航增加约 30 分钟;并且对超级中转站等进行优化, 支持手机、平板、PC 等不同端口,具备跨端流转能力。HarmonyOS 4 将 AI 大模型技术接入小艺,全新小艺增强自然语言理解能力,支持用 户更日常的表述方式;增加智能摘要和文案辅助创作功能;可依托多模 态大模型技术,对已有图像进行个性化二次创作。

小米 14 搭载底层重构的澎湃 OS,支持人车家全生态。小米澎湃 OS 重 构子系统,优化内存管理提高应用启动速度。澎湃 OS 拥有 AI 大模型植 入系统,基于端侧大模型的小爱助手可智能创作文本、快速撰写购物评 价、生成发言稿等。小米 14 内嵌图像应用可实现 AI 妙画、AI 搜图、 AI 写真、AI 扩图等功能。搭载的 Xiaomi HyperConnect 可实现所有智能 设备实时统一组网,可在手机、平板等设备的“融合设备中心”进行快捷 控制。 搭载 ColorOS 14 的 OPPO Find X7 实现 AndesGPT 模型端云协同。 ColorOS 14 系统端侧支持 70 亿参数的 AndesGPT·Tiny 大模型,云端支 持 AndesGPT·Turbo/Titan 大模型。OPPO Find X7 搭载 ColorOS 14 系统, 内置小布助手具有智能摘要、智能消除、内容创作等 AI 功能,并且系 统内置的图像软件具有 AIGC 消除效果,可智能生成写真照片。

Vivo OriginOS 4 搭载自研 BlueLM,X100 系列具备丰富 AI 功能。基于 10 亿参数 BlueLM 的 Vivo X100 系列,其内置的 AI 助手“蓝心小 v”具备 超能语义搜索、超能问答、超能写作、超能创图和超感智慧交互等功能, 能够实现智能问答、文案撰写、摘要生成、图片编辑。摄影应用基于生 成式 AI,通过人像识别、场景识别等功能可优化拍摄效果。

2.2. 进阶版 AI 手机:基于意图交互的 AI OS

意图交互升华 AI 认知,AI OS 深度融合端侧大模型。AI OS 改变原有操 作系统指令式的工作逻辑,通过集成智能感知技术实时获取用户行为、 偏好等环境信息,实现意图式人机交互,使 AI 或系统可更好地理解用 户当下所处场景及基于自然语言的用户指令;通过将端侧大模型融入底 层架构,AI OS 可持续从与用户交互过程中学习并优化自身性能,为用 户提供更个性化、精准的服务;基于 AI OS 的 AI 助理可理解应用界面 及相应功能,通过调用应用 APP,自动完成用户任务,简化重复枯燥的 操作过程。 荣耀 MagicOS 8.0 首次实现意图识别人机交互。与主要负责管理硬件资 源的传统 OS 内核不同,Magic Live 平台级 AI 负责“管理”与人相关的因 子,如个人知识库、位置与状态、习惯与画像等,帮助 OS 精准识别用 户意图,高效调度系统服务。基于 Magic Live 平台级 AI 的场景感知、 意图决策、用户理解能力,Magic OS8.0 支持自然语言、语音、图片、 手势、眼动等多模态交互方式,可智能识别用户意图,进行快速推理决策,主动提供个人化服务,提升交互效率。MagicOS 8.0 内嵌的任意门 功能可基于意图识别让服务实现跨应用、跨设备一步直达、智慧流转, 支持 100 多款国内主流应用服务,覆盖出行、办公、社交、搜索、娱乐、 购物、美食等应用场景。内置的 YOYO 智能助理可理解用户意图,高效 安全地连接云侧大模型,分发、融合、调度原子化服务,完成复杂任务 闭环。

苹果 Ferret UI 模型增强 iOS 意图识别,致力打造 AI OS。Ferret UI 以 Ferret 模型为基础,通过将手机 UI 界面分割为更小的子图像捕捉 UI 界 面细节特征,并将所有子图像单独编码获取图像特征,最后将子图像与 全局图像特征输入端侧大模型中,使端侧大模型可更好地捕捉 UI 界面 细节信息。并且 Ferret UI 通过收集各种初级 UI 任务的训练数据,如图 标识别、查找文本、组件列表等,以精准定位和理解 UI 组件;通过收 集与 AI 交互相关的高级任务数据集,如详细描述、感知/交互对话和功 能推理,以增强模型与 UI 相关的推理能力。基于 Ferret UI 可显著增强 AI OS 对手机 UI 界面的理解能力,并可根据用户指令找到具体元素完成 交互。

iPhone 环境下 Ferret UI 性能接近或超过 GPT-4V。Ferret UI 模型可完 成简单的 UI 定位和查询任务,在 iPhone 环境下 130 亿参数的 Ferret UI 模型在初级 UI 任务中超越 GPT-4V。并且可根据 UI 与用户进行感知对 话、交互对话,告诉用户相应位置具体的 UI 内容,如何与 UI 进行交互, 根据 UI 元素推断软件功能,在高级任务中的表现与 GPT-4V 接近。若 将 Ferret UI 与 AI 助理进行结合,AI 助理可深入理解用户意图,并基于 用户自然语言指令与手机 APP 进行交互,实现 AI 系统级应用。

Siri 将迎来重大革新,iOS18 预计搭载更多 AI 功能。根据彭博社,苹果 正在改进 Siri 和消息应用程序间的交互,使 Siri 更有效地自动生成文本 并回答复杂问题;根据 The information 报道,Siri 将与 Shortcuts 应用程 序进行更深入的集成,进而可自动执行复杂任务。2024 年 5 月 13 日 OpenAI 发布 GPT-4o,其具备强大的语音和视觉感知功能。用户无需等 待模型完成发言即可插话,回应音频输入平均时间仅为 320 毫秒,较 GPT-3.5/ GPT-4 下降 88.6%/94.1%,并且可根据语气判断用户情绪,针 对用户情绪改变自身语气,拟人化程度大幅提升。根据 OpenAI 官网, GPT-4o 在 MMLU、GPQA、MATH、HumanEval 等推理测试中超越 GPT-4 Turbo、Claude 3 Opusn、Gemini Pro 1.5 等前沿模型,并且在 MLS 基准 测试中优于 Whisper-v3 以及 Meta、谷歌的语音模型。根据彭博社报道, 苹果已与 OpenAI 达成合作协议,计划在 6 月 11 日 WWDC 全球开发者 大会公布一系列全新人工智慧技术。OpenAI 技术加持的 Siri 有望以低延 迟进行语音对话,提高人机语音交互的自然流畅度。并且有望增强用户 情绪感知,大幅提升拟人化水平。根据彭博社,苹果与 OpenAI 双方正 确认一项新协议,将 ChatGPT 技术应用在 iOS 18 中。根据 macrumors, iOS18 中多款应用程序如 Spotlight、Apple Music、Keynote、Shortcuts 等将具备生成式 AI 功能。

2.3. 高级版 AI 手机:全自主执行能力的 AI Agent

AI OS 的最终形态是具有全自主执行能力的数字人格。《PERSONAL 大 模型 AGENTS: INSIGHTS AND SURVEY ABOUT THE CAPABILITY, EFFICIENCY AND SECURITY》基于 AI Agent 智能水平将其分为 L1-L5 五个级别。具有意图交互与自我学习能力的 AI OS 将帮助 AI 助理深入 理解用户需求,持续学习用户个人习惯等信息。伴随手机硬件配置升级 以及端侧大模型推理性能提升,基于 AI OS 的 AI 助理有望成长为高度 智能化的数字人格,可根据用户指令自主生成任务规划,完美执行用户 任务并进行反馈。

AutoGPT 具备长期和短期记忆管理,可实现任务自主规划及执行。 AutoGPT 是基于 GPT-3.5 或 GPT-4 API 接口开发的 AI Agent,其可将用 户提出的复杂任务拆解为多项子任务,自动生成相应任务提示并执行, 无需用户进行干预和指导。并且可以基于互联网搜索获取最新数据、新 闻等信息,实现知识库实时更新。通过集成 Pinecone 数据库,AutoGPT 可保存与用户的对话、文本和上下文信息,并在对话中快速检索相关的 内容,回顾历史对话,进而更好地理解用户需求,提供更个性化的服务。

Mobile-agent 打破 APP 界限,联用多款应用实现拟人化操作。 Mobile-Agent 基于视觉感知模块可从设备屏幕截图中准确定位视觉和文 本元素以及图标信息,并通过视觉信息将语言模型生成的操作指令映射 到具体的屏幕位置执行点击等操作。其具备自主规划能力,能够根据操 作历史和系统提示自主规划新的任务。并且引入自我反思机制,在执行 过程中若遇到错误或无效操作,可根据屏幕截图和操作历史进行反思, 尝试替代操作或修改当前操作的参数。目前 Mobile-agent 已学会阿里巴 巴、TikTok、Youtube 等 10 项 APP 使用,并在部分跨应用场景中取得出 色的结果。

2.4. 具备丰富大模型技术储备、出色 AI OS 与硬件开发能力 的手机厂商将取得领先地位 

高性能端侧大模型、AI OS 与出色硬件配置是 AI 手机核心。端侧大模 型是 AI 手机智能核心,其性能将直接影响 AI 手机的使用体验;将端侧 大模型融入底层架构的 AI OS 具备出色的意图交互能力,深化 AI 手机 对用户需求的理解,并且可更好地调用硬件资源,充分发挥端侧大模型 性能;CPU、GPU 和 NPU 等硬件满足端侧大模型运算的算力需求,具 有更高硬件配置的 AI 手机可率先搭载更强性能的端侧大模型,为用户 提供更佳 AI 服务体验。 苹果 AI OS 系统开发领先,自研芯片性能强劲,端侧大模型进展顺利, 有望率先开发具备完整 AI 体验的 AI 手机。AI OS:苹果开发的 Ferret UI模型增强 AI OS 对手机 UI 界面的理解能力,可根据用户指令与手机应 用进行交互。结合 AI 助理将赋予 AI 助理对手机应用的深度理解,有望 实现 AI 助理自主调用 APP,完美执行用户指令。通过与 OpenAI 进行合 作,预计将实现 Siri 重大革新并且 iOS18 将增加多项 AI 功能;芯片: 苹果自研 A 系列芯片性能出众,根据 Geekbench 6,最新的 A17Pro 单 核性能较骁龙 8 Gen3 高 26%,NPU 算力达 35 TOPS;端侧大模型:2024 年 4 月苹果在 Hugging Face 发布 4 款 OpenELM,参数量分别为 2.7 亿、 4.5 亿、11 亿和 30 亿。其采用层级缩放策略,通过在 Transformer 模型 的每一层有效分配参数,显著提升模型的准确率。根据《OpenELM: An Efficient Language Model Family with Open Training and Inference Framework》,在使用 1/2 的预训练数据下,参数 1B 的 OpenELM 在零样 本训练、leaderbroad 任务和大模型 360 任务中的准确性较 OLMo 高 1.28%/2.36%/1.72%。苹果有望凭借出色的芯片研发能力以及对操作系统 的深刻理解,在 AI 手机开发中取得领先地位。

谷歌率先布局大模型,积极推进 Tensor 处理器研发弥补硬件短板。端 侧大模型:2023 年谷歌发布具备万亿参数的大模型,Gemini。并以 Gemini 为基座模型开发参数量 1.8B/3.25B 的 Gemini Nano,目前已应用至谷歌 Pixel 8 pro、三星 Galaxy S24 系列手机中。AI OS:谷歌发布的 screen AI 模型通过采用图像编码器和语言编码器提取图像与文本特征,可以识别 UI 元素的类型和位置,增强图像理解等多模态任务能力,深化对手机界 面的理解。最新推出的 Android 14 系统搭载 AI 助理 Gemini,增加生成 式 AI 功能。AI Core 可调用管理 Gemini Nano 等端侧模型,便于开发者 进行大模型调整和创新,助力构建 AI 应用生态;处理器:Tensor G3 处 理器 CPU 单核及多核性能分别为 A17 Pro 的 60.4%/61.7%。自研 TPU 芯 片,可提高 AI 手机中 AI 消除、AI 视频强化等性能。根据 9to5google, Tensor G4 将采用三星 4 nm 制程工艺与更先进的 FOWLP 封装工艺,进 一步提高能效比以及散热水平,为 AI 手机提供更佳性能支持。谷歌在大模型、操作系统领域具有丰富的技术积累,但自研处理器性能具有较 大改进空间,未来仍需增强处理器性能以将更高性能端侧大模型搭载至 AI 手机。

3. AI OS 需搭载 10B~100B 端侧大模型,高性能需求 掀起硬件革新浪潮

AI OS 的端侧大模型参数量应在百亿~千亿水平。意图交互能力是实现 AI OS 的前提,可使 AI 手机更懂用户诉求,提供更优质的服务体验。通 过进一步增加端侧大模型参数量、改进端侧大模型的自学习性能可提高 AI Agent 的智能化水平,实现 AI Agent 自主规划并完美执行用户指令, 无需用户进行干预。因此 AI 手机搭载的端侧大模型,其参数量至少需 达到意图交互功能所需的参数量要求,然后通过硬件性能优化等方式支 撑更高性能端侧大模型,逐步接近高智能 AI Agent 所需参数水平。根据 荣耀官网,Magic OS8.0 系统搭载的端侧大模型模型参数量为 7B,苹果 Ferret UI 模型的参数量为 13B,意图交互能力所需端侧大模型参数在百 亿级别。可实现任务自主规划及执行的 AutoGPT 和具备出色视觉感知、 可自主规划并调用 Tiktok、淘宝等应用程序的 Mobile-Agent 分别依赖参 数量 175B 的 GPT-3.5 及参数量万亿以上的 GPT-4V。考虑到手机终端算 力性能有限,我们认为手机搭载的 AI Agent 所需端侧大模型参数量将显 著低于 ChatGPT 的 175B,预计将通过模型压缩等方法将模型参数量降 低至千亿以下。

3.1. 异构计算突破算力瓶颈,骁龙、天玑、苹果 A 更新迭代 提供坚实算力支撑

百亿参数端侧大模型峰值算力需求达 100TOPS 以上。苹果提出的具有 意图识别能力的Ferret UI模型参数量达13B,我们基于此计算搭载AI OS 的 AI 手机所需最低算力。假定用户手机屏幕分辨率为 1920*1080,用户 最大可允许屏幕推理时间为 2s,硬件算力利用率为 60%。根据 OpenAI, 1 张高分辨率图像=85+170*(图像分辨率/512×512)tokens,经测算模 型所需峰值算力达 99 TOPS。因此搭载 AI OS 的 AI 手机,处理器算力 需达到 100 TOPS 以上。

集成 NPU 的异构计算具备最高能效比。生成式 AI 部署增加手机终端计 算需求,主要可分为:(1)按需型需求,由用户触发需立即响应,包括 图像生成、代码和会议摘要生成等;(2)持续型需求,运行时间较长, 包括语音识别、视频优化、实时翻译等;(3)泛在型需求,在后台持续 运行,包括始终开启的预测性 AI 助手、基于情境感知的 AI 个性化和高 级文本自动填充。手机终端搭载的通用 CPU 和 GPU 难以满足生成式 AI 严苛且多样化的计算诉求。通过集成专为 AI 定制的 NPU,以降低部分 易编程性为代价可实现更高的峰值性能、能效和面积效率,进而可运行 机器学习所需的大量乘法、加法和其他运算。基于 CPU+GPU+NPU 异 构计算的处理器能够实现最佳手机应用性能、能效和电池续航,赋予增 强的生成式 AI 体验。

骁龙 8 Gen3 搭载全新 Hexagon NPU,AI 算力大幅升级。骁龙 8 Gen3 搭载Hexagon NPU为持续型AI推理带来98%性能提升和40%能效提升, 处理器整体峰值算力达 73 TOPS,支持 100 亿参数端侧大模型。通过升 级微切片推理降低内存带宽占用,并支持 4.8 GHz LPDDR5x,内存带宽 可达77 GB/s。CPU和GPU性能较前代提升30%/25%,能效提升20%/25%。 高通在 MWC 2024 宣布骁龙 8 Gen4 将采用台积电 3 nm 工艺制程,放弃 Arm 公版架构,采用高通自研 Oryon 内核,并将集成 Adreno 830 GPU, 有望进一步提升处理器算力。

天玑 9300+内置硬件级生成式 AI 引擎,最高支持 330 亿参数 AI 模型。 天玑 9300+是业界首款生成式 AI 端侧双 LORA 融合的芯片,Llama2-7B 端侧大模型运行速度可达 22 tokens/秒,最高支持运行 330 亿参数模型。 联发科与百度、百川智能、阿里云、谷歌、Meta 等国内外大模型巨头达 成合作,支持阿里云通义千问、百川大模型、文心大模型、谷歌 Gemini Nano、零一万物等 AI 大模型。根据 CNMO,天玑 9400 预计将在 2024Q4 发布,采用台积电 3 nm 制程并沿用 ARM 内核,CPU 大核由 Cortex-X4 升级至 Cortex-X5。

苹果 A17 Pro 率先采用 3 nm 制程工艺,NPU 算力达 35 TOPS。A17 Pro 搭载 16 核神经网络引擎,NPU 算力较 A16 Bionic 提高 100%。CPU 和 GPU 均采用 6 核设计,性能核心提升最高可达 10%/20%。根据 9to5Mac, A18 芯片具备更大的尺寸,并将大幅增加内置 AI 计算核心数量,预计 将搭载至 iPhone 16 和 iPhone 16 Pro。根据 GIZMOCHINA,A18 Pro 在 Geekbench 6 上的单核和多核跑分分别为 3570/9310,较 A17 Pro 高 22%/28%。

工艺制程升级+先进封装是处理器未来发展方向。根据台积电,与 5nm 制程技术相比,3nm 制程的逻辑密度增加约 70%,可实现相同功耗下频 率提升 10-15%,或相同频率下功耗降低 25-30%,进一步提高芯片的运 算能力以及能效比。目前台积电规划的 3 nm 制程包括 N3B、N3E、N3P、 N3X、N3AE,其中 N3B 已应用至苹果的 A17 Pro,预计骁龙 8 Gen4 将 使用成本优化后的 N3E。N3P 性能将进一步提升,预计 2024 年下半年 投产;N3X 聚焦高性能计算设备,预计 2025 年进入量产阶段。以 Chiplet 为代表的 3D 封装技术,通过芯片封装小型化、高密度化,可实现异质 异构的系统集成以及高互联密度与低信号传输延迟。并且先进封装有望 延续摩尔定律,持续提升芯片性能并降低先进制程工艺成本。AI 手机处 理器有望基于先进封装突破摩尔定律限制,持续增强 AI 算力。 图 20:以 Chiplet 为代表的先进封装技术将持续提升处理器算

3.2. 内存升级+模型优化加速 AI 手机智能进化

端侧大模型部署驱动手机内存升级,16 GB 是 AI 手机基本配置。根据 智源社区,FP32 全精度的 llama2 13B 模型推理所需最低内存为 52 GB, 经过 Int4 量化后,其推理占用内存仍有 6.5 GB,考虑到手机运行安卓操 作系统使用内存为 4GB 左右,后台运行其他手机 APP 需要 6GB 左右内 存,累计内存需求达 16.5 GB。根据 IDC,16 GB 内存将成为 AI 手机基 础配置。目前 OPPO、vivo、小米、荣耀等安卓厂商 AI 手机的最大内存 达到 16GB,可满足百亿参数端侧大模型运行的基本要求。苹果手机受 益于更高效的 iOS 系统,内存占用需求更低,目前 iPhone 15 Pro 及 iPhone 15 Pro Max 的最大内存为 8 GB。伴随具有更高智能水平与更多参数量的 端侧大模型部署至 AI 手机,AI 手机内存容量有望升级至 24GB 以上。

基于模型压缩可在有限内存下部署更高性能端侧大模型。目前模型压缩 方法主要包括数值量化、稀疏化处理、知识蒸馏等。数值量化通过简化 数据或减少表示数值的比特数压缩模型大小。根据 OPPO,Find X7 部署 的 70 亿参数 AndesGPT-Tiny 模型,正常的内存占用为 28 GB,无法搭 载至 AI 手机中。经过 INT4 对模型进行压缩后,内存占用由 28 GB 降低 至 3.9 GB,实现 AndesGPT-Tiny 模型端侧部署。稀疏化处理主要是去除 模型中数值为 0 或接近 0 的权值。微软提出的 SliceGPT 技术可在保持 llama-2 70B 模型 99%零样本任务性能的前提下,剪除 25%模型参数。知 识蒸馏则是基于参数多、结构复杂的教师网络训练小参数学生网络,以 期获得相似或更好性能。通过模型压缩可突破内存限制,加速更高参数 端侧大模型部署,加快打造智能化 AI OS。

苹果通过优化闪存内存交互和内存管理,可加载较设备 DRAM 大两倍 的端侧大模型。目前调用大模型的方法是将整个模型加载至 DRAM 中 进行推理,需占用较大内存容量。苹果提出将模型参数存储在容量更高 的闪存中,在推理过程中仅从闪存中加载所需参数。其通过滑动窗口技 术仅增量加载与之前不同的神经元数据并释放滑窗外 token 占用的内存。 同时以行列捆绑方式读取更大数据块,提高闪存数据吞吐量。通过及时 删除冗余神经元、将新神经元插入预先分配数据结构消除 DRAM 重新分配内存和复制现有数据的需要,减少推理延迟。基于该方法可加载较 设备 DRAM 大两倍的端侧大模型,并且在 CPU 和 GPU 上加载速度分别 比传统方法提高 4-5 倍和 20-25 倍。

内存带宽限制 AI 手机性能,LPDDR6 预计将加速渗透。根据联发科, 运行 130 亿参数端侧大模型所需内存带宽为 130 GB/s,目前已发布的 AI 手机搭载的最优 DRAM 为 LPDDR5×,数据传输速度为 8.5 Gbps,理 论峰值带宽为 68.3 GB/s,远未达到百亿参数大模型数据传输需求,限制 端侧大模型数据处理能力。JEDEC 固态技术协会预计在 2024Q3 发布 LPDDR 6 内存标准定稿,LPDDR 6/LPDDR6X 数据传输速度分别将达到 12.8/17 Gbps,理论峰值带宽达到 102.4/136 GB/s,可完全释放百亿参数 端侧大模型性能,预计将加速搭载至 AI 手机中。GSMArena 预计骁龙 8 Gen4 旗舰会率先搭载 LPDDR6。

3.3. 散热、电池、PCB/IC 全面升级

AI 手机功耗提升催生更强散热需求,助力石墨烯膜渗透率提升。根据富 烯科技招股说明书,目前智能手机主流散热方案是人工石墨散热膜+热 管+均热板。AI 端侧大模型的高算力需求将提高处理器功耗,石墨烯膜 理论导热系数达 5300 W/(m.K),较人工石墨散热膜高 165%以上,可有 效提高散热能力。根据 OFweek 统计,2020 年中国手机散热膜市场中, 人工石墨散热膜和石墨烯散热膜占比分别为 82.8%和 12.1%。目前小米 14 系列手机已采用多层石墨烯膜作为散热材料,iphone 16 拟采用石墨 烯膜散热材料,石墨烯膜在散热材料中的占比有望提升。

硅碳负极有望成为 AI 手机电池标配,复合铝箔实现能量密度升级。传 统手机电池采用石墨作为电池负极,石墨负极理论克容量仅为 372 mAh/g。硅基负极理论克容量达 4200 mAh/g。但其循环稳定性弱且导电 性不佳,需要进行改性以解决膨胀、失效等问题。目前产业化进展最快 的改性方法是将碳材料引入硅/氧化亚硅中形成硅碳复合结构负极(硅碳 负极)。硅碳负极不仅可以有效提升锂离子电池负极的比容量,还可以 有效改善电极的导电性能。小米“金沙江”电池采用高密度硅碳负极,电 池容量达 5300 mAh,最高硅含量 6%,电池体积降低 8%,续航提升 17%。 OPPO Find X7 及 Magic 6 系列也采用新型硅碳负极电池,电池容量均达 到 5000 mAh以上。伴随AI手机功耗提高,高能量密度电池是必然需求, 硅碳负极具有良好发展前景。复合铝箔是具有“铝-PET 高分子材料支撑 层-铝”三明治结构的新型复合箔材。其在厚度不变情况下可大幅减少铝 用量,实现同样重量下能量密度提升,提高电池续航能力。采用复合铝 箔替代锂电池传统铝箔,有望升级手机电池续航,为 AI 手机提供充沛 动力。

高频高速+先进封装带动 IC 载板需求增长。AI 手机将搭载高运算性能 的处理器实现云端大模型高效协同,对数据传输速率以及功耗提出更高 要求。PCB 作为承载数据传输的基础硬件载体,伴随数据传输与处理速 率要求提升,高频高速是未来发展的必然趋势。IC 载板属于 PCB 高端 产品,具有高密度、高精度、高性能、小型化以及轻薄化等优良特性。 伴随先进封装等技术发展,IC载板在PCB板占比逐步提升。根据prismark, 2020 年 IC 载板占比为 15.68%,预计 2026 年占比将达到 21.11%。根据 Yole,2022-2028 年全球先进 IC 载板市场规模将由 181.8 亿美元增长至 340 亿美元,CAGR 达 11%。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

加载中...