手机芯片会战AI大模型,Arm有何胜负手?
6月13-14日,Arm在北京举办了2024技术媒体分享日,介绍了近期推出的面向消费电子设备的全新计算子系统——Arm终端计算子系统(CSS),该平台囊括最新的Armv9.2 CPU集群、Arm Immortails、Arm Mail GPU,以及最新的CoreLink互联系统IP和系统内存管理单元 (SMMU),并首次在终端领域提供基于三纳米工艺生产就绪的CPU和GPU物理实现。
图源:Arm
作为移动处理器市场最主流的架构,Arm的每一次更新都会引领整个移动市场的革新,此次推出终端CSS,又会带来哪些改变?
Arm终端CSS:AI消费电子的最新解
我们先来看看Arm终端CSS涵盖了些什么,首先是Armv9.2 CPU集群,Arm为我们带来了新的Cortex-X925、Cortex-A725和更新的Cortex-A520 CPU核心,其中Cortex-X925是新一代的超高性能核心,主频可达3.6GHz以上,单线程性能较上一代提高了36%,并且带来了46%的AI性能提升。
图源:Arm
所谓的Armv9.2是Arm在2021年推出的最新一代Armv9架构的最新版本,Armv9架构本身就是专为性能和AI而设计。在过去几年的架构演进中,Arm为其增添了矢量加速、机器学习 (ML) 等领域的计算能力,同时增强了系统的安全性和稳健性,而采用Armv9.2 CPU集群的Arm终端CSS的表现更是令人期待!
众所周知,AI已经成为目前的核心需求之一,在关键的AI推理性能上,Cortex-X925的提升达到59%,在采用双颗Cortex-X925核心设计的情况下,终端CSS的CPU集群在推理性能上最高可以得到170%的性能提升。
图源:Arm
而作为效率核心的Cortex-A725表现突出,与上一代对比在性能效率上也提升了35%,能效提升25%,借助更好的预取器和更大的L2缓存,L3流量减少了20%,使其能够为中高端设备提供高效能比的AI运算支持。
得益于显著的AI性能提升,Arm终端CSS能够为新一代消费电子设备提供足够的AI算力支持,使得合作伙伴可以在更多的消费电子产品上实现AI功能的部署与应用。
相较于以往的解决方案,Arm终端 CSS 专为高端终端设备细分市场设计,在性能、效率和可扩展性方面带来了突破性变化。
以最新的Armv9.2 CPU集群为例,可以提供从旗舰Cortex-X925到高效的Cortex-A725,以及更新的Cortex-A520,合作伙伴可根据自己的需求进行选择和配置。Arm的计算平台赋予合作伙伴很强大的灵活性,比如去年11月份MediaTek发布的天玑9300就采用了全大核的 Armv9 CPU 集群,包括四个Cortex-X4(Cortex-X925前代)和四个Cortex-A720(Cortex-A725前代),而没有使用“小核”Cortex-A520。
此次推出的GPU系列产品也具备很强的可拓展性,可为各类不同级别的设备带来出色的游戏体验。其中,Immortails-G925支持从10核到24核心的性能配置,使得Immortails-G925的适配范围可以横跨手机和PC多个领域,满足不同层级的GPU性能需求。
图源:Arm
性能上,Immortails-G925对比上一代提升达37%,在提供相同的游戏性能时,功耗较上一代降低了30%。这也意味着,在游戏体验不变的情况下,采用Immortails-G925的芯片在整体能耗上会明显低于上一代,在手机等小型移动设备上使用时可以显著提升游戏续航时间。
Immortails-G925带给我们的惊喜除了性能和能效上的提升之外,还引入了新的“片段预处理”机制。利用这项新的技术,应用无需进行任何对象或原语排序。片段预处理还可以更高效地减少过度绘制,进而提高性能和能效,同时减少应用的 CPU 负载。在Arm内部工作负载中,观察到渲染线程周期缩短了高达 43%。
图源:Arm
此外,Immortails-G925针对光线追踪功能也做了显著的升级,对复杂对象的光线追踪性能提高了52%,并且降低了57%的内存流量,进而能够大幅降低功耗,并使其可以应用到各种场景中。
而Arm Mail系列则新推出了两款GPU,分别是Mail-G725和Mail-G625,分别针对中高端手机和入门级移动设备,Mail-G725支持在6-9个核心之间扩展,而Mail-G625则支持在1-5个核心之间扩展,为移动设备的处理器设计提供了更多的选择。
实际上,如今越来越多设备都需要在运行中使用到高性能的GPU核心,但是GPU核心的高能耗也困扰着部分小型、入门级设备,Arm通过提供更灵活的GPU选择,使得入门级设备也能享受到新一代GPU核心的高能效性能。
赋能AI,共创Arm智能生态
Arm无疑是目前移动市场中最主流、广泛的芯片架构,想要在移动端市场普及AI,Arm架构的解决方案可以说是最好的选择。在此次分享会中Arm的多位演讲者也屡屡提到AI,除了在硬件层面为AI提供算力支持外,Arm更是在一直着力于打造更开放、全面、易用的开发环境。
为了支持开发者充分利用最新硬件的性能,Arm推出了全新的Kleidi软件,包含KleidiAI和KleidiCV库,专为优化端侧AI和计算机视觉工作负载设计,通过这些工具,开发者可以更轻松地进行高效能软件开发,加速产品的上市进程。
图源:Arm
其中KleidiAI是一套面向AI框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持Neon、SVE2和SME2 等关键Arm架构功能。KleidiAI与PyTorch、Tensorflow、MediaPipe等热门 AI 框架集成,旨在加速 Meta Llama 3、Phi-3等关键模型的性能,并且还可前后兼容,以确保 Arm 在引入更多技术时依然能适用未来市场的需求。
而对于需要用到计算机视觉解决方案的开发者来说,KleidiCV的引入能带来巨大的性能提升。计算机视觉现在与 AI 紧密相连,但这些摄像头管线可不仅仅运行神经网络,还有很多传统的计算机视觉算法,其性能对于摄像头或社交媒体应用的顺畅运行至关重要。
图源:Arm
这正是Arm构建KleidiCV的原因。今年,Arm还与OpenCV.ai 合作,力求让安卓开发者可以更轻松地将OpenCV纳入到他们的项目中,并从KleidiCV带来的改进中受益。
KleidiAI和KleidiCV的结合,使得Arm生态的开发者在智能终端上轻松部署AI应用与功能,为AI生态的搭建提供有力支持。
今年,Arm在性能分析工具领域也有一些新的变化。首先大家熟悉的Arm Mobile Studio正式更名为Arm Performance Studio,其针对移动平台的功能没有任何变化,但现在通过增加对Arm Linux 的支持,基础设施市场中的开发者可以使用 Streamline CPU分析能力。
图源:Arm
与此同时,适用于安卓系统的 CSS 参考软件栈搭配固定虚拟平台 (Fixed Virtual Platform, FVP),可助力合作伙伴加速流片前的软件开发。
此外,Arm与多个行业领导者合作,推出了一系列开发者支持计划和社区资源。这些计划包括在线培训课程、开发者论坛和技术支持服务,旨在帮助开发者更好地理解和使用Arm的技术。授人以鱼不如授人以渔,Arm显然也深刻地明白这个道理,而且一个健康可持续的软件生态也需要更多的建设者。
在Arm提供的这些资源帮助下,开发者不仅可以提高自己的技能,还可以与全球的开发者交流经验和分享创意。同时,Arm还通过与硬件制造商和软件开发公司合作,不断优化其工具和平台。
图源:Arm
比如,Arm与知名的IDEs(集成开发环境)如Visual Studio Code和Eclipse进行了深度集成,使得开发者能够在熟悉的环境中进行高效地开发工作。通过这种深度合作,Arm确保其开发工具能够无缝融入开发者的日常工作流程,提高生产力和开发质量。
从电脑到手机,从智能冰箱到智能手表,Arm的解决方案无处不在,丰富的生态产品使得Arm可以为开发者提供充足的开发空间,并且支持开发者探索不同的领域。
ALL FOR AI
毫无疑问,AI的需求使得智能终端生态在过去的一年里迎来了新的爆发式增长,人们正在不停地尝试、开拓新的应用范例、探索新的硬件形态,寻找着能够为消费者带来更好体验的产品,不管是软件还是硬件的。
而Arm终端CSS及Kleidi软件,将会是开发者探索新世界的最佳方式之一,得益于全新的半导体工艺与芯片架构,我们如今已经能够在小巧的手机上,获得不亚于PC的算力与性能支持。Arm终端CSS所带来的Armv9.2的能效优势,凭借物理实现和持续的软件优化,它将彻底革新开发者和消费者的体验。
随着未来的AI生态继续发展,我们无疑将会看到更多基于Arm解决方案打造的新一代智能终端产品,而AI生态的需求也将继续驱动Arm开发更高性能、更具效率的新产品。
未来,Arm将继续以其先进的技术、丰富的软硬件和强大的生态系统支持,不断赋能开发者,推动计算技术向前发展。无论是在高性能计算、人工智能还是计算机视觉领域,Arm都展示了其作为行业领导者的实力,通过持续创新和深耕开发者生态系统,Arm正引领着未来计算的方向,为行业注入新的活力。
来源:雷科技
原文标题 : 手机芯片会战AI大模型,Arm有何胜负手?
图片新闻
技术文库
最新活动更多
-
1月8日火热报名中>> Allegro助力汽车电气化和底盘解决方案优化在线研讨会
-
1月9日立即预约>>> 【直播】ADI电能计量方案:新一代直流表、EV充电器和S级电能表
-
即日-1.16立即报名>>> 【在线会议】ImSym 开启全流程成像仿真时代
-
即日-1.20限时下载>>> 爱德克(IDEC)设备及工业现场安全解决方案
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
-
即日--2.7了解详情>> 【森海塞尔】TeamConnect系列产品——提升视听之体验,塑造音频之未来
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论