【AI前沿】一经发布震惊全球，看华为如何实力“碾压”高通与苹果！

2018-09-04 10:27

其他 AI 手机方案竞争者

即将引入硬件 NPU 的高通

作为全球最大的手机方案供应商，高通过去通过 Hexagon 与 GPU、CPU 协同工作，达成对主流AI 框架的计算加速能力，虽然在效率上还是明显落后苹果与华为的硬件方案，但总是给市场一个交代。

然而，异构计算（Heterogeneous computing）虽然弹性高，且可以有效利用芯片中的不同类型计算架构，但目前 AI 计算方案讲求的是更高的能效表现，而在手机等移动终端上，更显重要，虽然高通的异构计算已经属于相当高效的技术，但仍与 ASIC 有一定的落差，也因此，在使用针对 AI 加速框架进行性能的评比应用时，高通很明显要落后采用硬件 NPU 的竞争对手，未来如果 AI 模型往更复杂的方向发展，或者是同时需要执行多种 AI 服务，那么在发展空间上就可能会明显不如竞争对手了。

（来源：高通官网）

不过，高通也不是不知应变，根据市场传闻，其在下一代中高端方案骁龙 700 系列中，将引入硬件 NPU 设计，而如果成真，其下一代高端方案，也就是骁龙 855，也将可能沿用同样的方式。

而目前高通也引进了包含商汤等多家 AI 算法设计公司所设计出来的应用框架，想要快速冲刺相关市场，不过高通目前的 AI 性能还有相当大的改善空间，如果要负载更复杂、多元的 AI 计算，恐怕还是要等到下一世代的 AI 设计问世。而根据 DT 君得到的信息，高通将在 12 月正式发布新一代的高端 AI 手机方案，按照往例，明年初就可以见到实际终端产品。

三星从抄袭到走出自己的路，Exynos的半软半硬 AI 亦然

三星作为全球最大的手机厂商，其势力涵盖终端、消费、云端服务、半导体制造与设计等领域，而其中，手机市场是其最重视的一块，而为了推动其手机市场的布局，三星过去亦步亦趋的追随包含苹果与高通的步伐，并将学习到的设计精髓转化为自有的方案设计。

目前三星主要的芯片来源包含了自行设计的 Exynos 系列、高通的骁龙系列、联发科的低端 MT 系列，以及展讯的 SC 系列，市场从最高端，到最低等级，可能会被我们直接当作电子垃圾的产品，几乎都有覆盖。

目前 Exynos 9810 是三星的主力自产高端产品，今年的 Galaxy S9 系列、Note9 系列都可见到其身影，其采用的 AI 计算方式与高通类似，主要是通过 DSP、GPU 与 CPU 的协同计算，不过三星有个特殊的作法，那就是视觉相关的处理交由硬件，而非异构计算。

目前的 9810 采用脱胎自 Cortex－A75 的 M3 定制架构，并搭配 Cortex－A55 作为小核心，而与华为最大的不同是，三星在 GPU 规模上相当舍得下工本，其 Mali－G72 核心数量配置高达 18 个，比麒麟 970 多出 6 个，虽然芯片成本会较高，但可以在较低的时钟水频达到更稳定、更好的效能表现，换言之，能效也更好。

（来源：三星官网）

而 9810 中有个 VPU 计算单元，顾名思义，是用来处理视觉方面的计算工作，这个单元应该是硬件设计，但只能用来处理比较固定的功能，三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

而其他的 AI 计算工作就如高通般，是使用异构计算，统 GPU 与 CPU 来达成，这方面可能主要是沿用 Arm 的软件资源，三星也同样没有发布任何相关的开发套件给第三方开发者。

而下一代方案，也就是 Exynos 9820，将会采用 ARM DynamIQ 架构设计，并且将以“2＋2＋4”三丛集形式打造，其中两组大核将采用三星第四代自主架构“M4”，第二道两组大核则以 ARM Cortex－A75 构成（也可能以 Cortex－A76 取代），而小核部分则将以 4 组 ARM Cortex－A55 构成。

AI 部分则将可能维持 9810 的作法，那就是采用 VPU 硬件处理单元来处理部分视觉计算工作，并搭配既有的异构计算方式来处理标准 AI 计算框架，也就是半软半硬的方式。

最后，9810 采用的是三星 10nm工艺，而 9820 将可能是三星 7nm 方案首发，但因为三星的 7nm 采用 EUV 技术，目前还在调试中，真正量产最快也要今年底或明年初，这也可能让 9820 成为最晚推出的次世代 AI 手机芯片方案。

赚走最多钱的手机公司搞 AI——苹果

苹果基本的手机芯片布局是每年一款，当然，为了配合如平板电脑或者是手表等其他终端的产品时程，也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的 A11 Bionic，内建的硬件 NPU 是最大特色。而苹果在其芯片中往往都使用较少的核心，相较对手都已经走到 8 核以上，苹果 A11 还只是个 6核产品，但其表现出来的性能数据却远远超越所有竞争对手，其原因包括苹果对其使用的 Arm 架构深度定制化，并舍得为了特定性能目的来堆加更多晶体管，因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售，并创造更高的获利，因此每一代方案苹果也就更舍得堆料，形成正向发展。

（来源：苹果官网）

A11 使用的是台积电 10nm 工艺，这也是少数几次没有使用到三星代工工艺的苹果芯片，由于目前苹果的开发套件中，只开放 GPU 计算能力给开发者，而 GPU 也负担包括第三方 AI 应用的训练或推理的工作，对苹果而言，GPU 的份量也越来越重要，这也是之所以苹果要推动自有 GPU 架构的发展。

虽然目前所采用的 PowerVR 架构在性能与菜单现上相当出色，该公司也愿意配合苹果进行高度定制工作，但这对于苹果而言仍远远不足，而展望未来苹果对其 GPU 架构的布局，将可能是个结合绘图、计算以及推理、训练的全功能 AI 优化设计，当然，为了能耗表现，推理工作可能还是维持独立的 NPU 单元来进行。

而未来 A12 将会如何？其实在现阶段也只能猜测，唯一能确定的只有使用 7nm 制造工艺这点。而在架构方面，根据过去的惯例，性能的增长肯定是不能忽略的，毕竟对手也都在积极追赶，今年对手的主流方案都已经在整体性能上有相当大的改善，也拉近了与 A11 的距离，A12 肯定会在CPU 与 GPU 方面进行更深度的改造，不论是增加更多的处理管线，更优化 CPU 或 GPU 内部的流水线设计，亦或者粗暴的堆加核心，都是可能的作法。

至于在关键的 AI 硬件单元方面，除了强化效率以外，也可能就规模方面进行扩展，借以压制华为或高通等即将面世的下一代 AI 方案。

专注中低端的联发科

联发科 2018 年主打的 AI 手机方案 P60，具备 AI 专用计算模块的APU（AI specialized Processing Unit），基于 DSP 计算架构，而 CPU 则是采用Cortex－A73 搭配 Cortex－A53 的四大四小设计，虽然不是采用最新的 Cortex－A76，但性能表现仍有一定水准，GPU 方案则是使用 Mali－G72 这款相当稳定的 GPU 架构，不过可惜的是，联发科为了成本考虑，只采用 MP3 配置，并以高频率运作来补足性能表现，因此在运行游戏时，可能会对电池寿命产生负面影响。目前 P60 已经被应用在包含 OPPO 等多款手机产品当中，虽后的小改版产品也已经箭在弦上。

（来源：联发科官网）

目前，中国前几大手机厂商都是联发科的客户，产品多分布在中低端，包含华为、OPPO、VIVO、小米、魅族，以及其他二三线厂商，基本上都摆脱不了联发科，毕竟中低端手机中具备成本优势，产品线完整且技术更新还能跟上市场脚步，且能提供最好技术支持服务的，就属联发科了。而在前两年，联发科也打入三星的供应炼，通过使用一定比重的三星芯片代工工艺服务，三星也在其低端手机中采用联发科的方案作为交换。

联发科的方案成本相对较低，且过去在包裹 TurnKey 服务方面口碑极好，在中国的支持人力也最广泛，虽然是 AI 生态的后进者，但是在商汤等 AI 大公司的协助之下，或许第一时间就能够提出够成熟的语音与视觉 AI 方案，对客户而言，联发科一直都是便宜又大碗的选择。

对于HUAWEI Mate 20系列将会搭载980芯片你怎么看？又讲会给广大用户带来怎样的性能体验呢？

<上一页 1 2