新浪科技

英特尔锐炫GPU第一时间适配Llama 3 展现卓越性能

PChome

关注

英特尔就第一时间优化并验证了80亿和700亿参数的Llama 3模型,凭借英特尔锐炫显卡的强大性能,开发者能够轻松在本地运行Llama 3模型,为生成式AI工作负载提供加速。

Meta此前已经发布了新一代Llama 3大语言模型,在发布后不久,英特尔就第一时间优化并验证了80亿和700亿参数的Llama 3模型在英特尔AI产品组合上的运行情况。在客户端领域,测试表明凭借英特尔锐炫显卡的强大性能,开发者能够轻松在本地运行Llama 3模型,为生成式AI工作负载提供加速。

此外,英特尔酷睿Ultra H系列处理器展现出了高于普通人阅读速度的输出生成性能,而这一结果主要得益于其内置的英特尔锐炫GPU,该GPU具有8个Xe核心,以及DP4a AI加速器和高达120 GB/s的系统内存带宽。

英特尔酷睿Ultra处理器和英特尔锐炫显卡在Llama 3模型发布的第一时间便提供了良好适配,这彰显了英特尔和Meta携手为本地AI开发和数百万设备的部署所作出的努力。英特尔客户端硬件性能的大幅提升得益于用于本地研发的PyTorch和英特尔PyTorch扩展包等丰富的软件框架与工具,以及用于模型部署和推理的OpenVINO工具包。

而根据具体的测试样例来看,在使用IPEX-LLM库运行70亿参数的Mistral模型时,锐炫A770 16GB显卡每秒可以处理70个token(TPS),比使用CUDA的GeForce RTX 4060 8GB的TPS高出70%。英特尔内部测试表明,锐炫A770 16GB显卡在运行大模型时能够提供卓越的性能。相比RTX 4060,锐炫A770 16GB显卡在运行大多数模型时具备极有竞争力或领先的性能,这也使其成为在本地运行大语言模型的更优选择。

【Minimax闫俊杰:AI领域会有多个玩家持续存在 使其更普惠】7月26日,Minimax创始人兼首席执行官闫俊杰在2025世界人工智能大会暨人工智能全球治理高级别会议主论坛上表示,AI领域一定会有多个玩家持续存在,原因包括,不同公司的价值观会使不同的模型拥有自己的特点,使其能长期存在;此外,越来越多开源模型开始产生影响力,且越来越逼近最好的闭源模型。因此,AI会被掌握在多家公司或组织手中,并且会变得越来越普惠,使用成本更可控。

【泰军方向26国发函:柬埔寨率先开火并袭击平民】当地时间7月26日,泰国陆军情报局通过驻外武官渠道,向26个国家发出正式函件,称柬埔寨军队是率先发动攻击一方,柬方的攻击针对泰国平民、社区和医院,严重侵犯泰国主权。此次发函的对象包括美国、中国、俄罗斯、法国、英国、德国、澳大利亚、日本、韩国、土耳其、巴基斯坦、加拿大、新西兰、瑞士、比利时、意大利、白俄罗斯以及东盟国家等。泰方指出,柬军不仅开火在先,还非法进入泰国领土埋设杀伤人员地雷,违反《渥太华禁雷公约》,导致两名泰国士兵截肢,多人受伤。

【北京发布地质灾害黄色预警】北京市规划自然资源委联合市气象局7月26日11时继续发布地质灾害气象风险黄色预警,7月26日11时至7月27日11时,我市房山区西北部、门头沟区西南部、怀柔区东部、密云区大部、平谷区北部发生崩塌、滑坡、泥石流等地质灾害的风险较高(黄色预警);房山、门头沟大部,石景山区、丰台区、海淀区西部,昌平区西北部,延庆区、怀柔区大部,密云区东部和南部,平谷区中南部有发生崩塌、滑坡、泥石流等地质灾害的风险(蓝色预警),请注意防范。

【Minimax闫俊杰:AI领域会有多个玩家持续存在 使其更普惠】7月26日,Minimax创始人兼首席执行官闫俊杰在2025世界人工智能大会暨人工智能全球治理高级别会议主论坛上表示,AI领域一定会有多个玩家持续存在,原因包括,不同公司的价值观会使不同的模型拥有自己的特点,使其能长期存在;此外,越来越多开源模型开始产生影响力,且越来越逼近最好的闭源模型。因此,AI会被掌握在多家公司或组织手中,并且会变得越来越普惠,使用成本更可控。

【泰军方向26国发函:柬埔寨率先开火并袭击平民】当地时间7月26日,泰国陆军情报局通过驻外武官渠道,向26个国家发出正式函件,称柬埔寨军队是率先发动攻击一方,柬方的攻击针对泰国平民、社区和医院,严重侵犯泰国主权。此次发函的对象包括美国、中国、俄罗斯、法国、英国、德国、澳大利亚、日本、韩国、土耳其、巴基斯坦、加拿大、新西兰、瑞士、比利时、意大利、白俄罗斯以及东盟国家等。泰方指出,柬军不仅开火在先,还非法进入泰国领土埋设杀伤人员地雷,违反《渥太华禁雷公约》,导致两名泰国士兵截肢,多人受伤。

请输入评论内容

举报成功

举报

请您选择举报的原因

说说你的看法

意见/建议 反馈入口
  • TOKEN
  • 标题/昵称
  • 反馈内容

已反馈成功~