CPU性能提升乏力影响行业发展，未来怎么办

2018-12-01 09:30

虽然CPU仍然在不断发展，但是它的性能已经不再仅仅受限于单个处理器类型或制造工艺上了。

和过去相比，CPU性能提升的步伐明显放缓了，接下来怎么办，成为横亘在整个行业面前的大问题。

自2010年开始，单个CPU内核的处理能力就逐渐停止了增长的脚步，发热和噪声等和功耗相关的问题迫使处理器公司另辟蹊径，不再汲汲于推高时钟频率，转而在CPU中集成更多内核。多核设计的引入，下一代制造工艺对功耗和性能的改进，推动着处理器性能继续跟随着工艺升级的步伐大幅提升。但是现在，制造工艺升级对性能的提升幅度也大不如前，再加上许多公司已经完全停止了在更先进工艺节点上的努力，CPU性能的提升再次遇到了瓶颈。

CPU性能提升乏力的严峻现实影响到了多个行业的发展。软件开发人员已经习惯了并理所当然地预计计算和内存资源将会不断增长，但是现在，CPU性能提升的速度大不如前了。正是在摩尔定律的加持下，软件可编程能力和丰富的功能集合才得以出现并发挥重要作用，也给硬件工程师和软件工程师提供了一种缓冲。

“由于摩尔定律，计算能力的增长和加速在部分程度上应该归功于英特尔等公司不断前进到下一代工艺节点上，从而使得计算引擎本身的优化不再那么重要了，”Microchip旗下美高森美战略营销高级总监Nilam Ruparelia说。“再加上软件技术本身的进步，使得软件生产力提高的速度大大超过了摩尔定律。如果能够让编程变得轻松容易，就会有更多的人从事编程。通过软件完成各种事务的能力也已经大大增强。”

工艺的升级越来越难了。Flex Logix首席执行官Geoff Tate表示，“处理器已经不再是执行计算任务的唯一解决方案了。看看数据中心吧，之前，这里面唯一的处理器件只有x86，但是现在，各种配置的FPGA和GPU处理器的身影几乎无处不在。”

这种异构方案在人工智能／机器学习的设计中尤为普遍。“根据运算的性质，很有必要将矩阵运算或密集型的线性代数运算放到GPU上执行，”Arteris IP营销副总裁Kurt Shuler说。 “你可以设计自己专属的ASIC进一步优化计算性能，也可以把一些任务负荷分配到FPGA上。当然，你可能依然需要CPU来管理高级别的数据控制流。总之，处理器件的数量越来愈多，而且变得越来越复杂。如果你分析一下数据中心就会发现，它们变得越来越异构化了。”

之所以出现这种转变，是因为物理规律的限制。“我们在RISC和CISC架构上已经做到头了，”西门子旗下Mentor的Questa产品经理Gordon Allan警告说。“可编程性和传统逻辑都在演变。现在，各种定制逻辑器件实现通用功能，然后通过智能互联技术把所有这些功能融合在一起。而之前则是通过软件将一些微操作组合在一起形成算法。”

这当然不意味着CPU会消亡或者停止演进，只不过CPU架构师的工作变得更加困难了。“通用CPU架构和微架构依然会继续发展，而且足以高效地胜任大多数任务，并将设计、生态建设和复杂性维持在可持续的水平上。”Arm嵌入式和汽车业务线战略副总裁Tim Whitfield表示。

影响架构改变的最大障碍之一是可编程能力。“可编程能力的大小，甚至没有可编程能力也不会对整体效率带来多大影响，”Mentor的HLS平台项目主管Russell Klein说。 “传统的CPU、DSP、多核CPU和FPGA都是可编程的，但具有截然不同的效率和不同的编程难度。可编程能力在一定程度上降低了效率，但是影响效率的主要因素却在于并行计算能力。DSP具有执行特定任务的能力，其效率高过CPU。GPU也有一些特定于专业领域的计算单元，而且引入了并行计算。FPGA和ASIC的并行计算能力更为出色。”

硬件器件的异化比较容易，摆脱旧有的软件范式却非常艰难。“业界将应用程序进行更改，以适应更广泛的芯片类型。”Allan说。“这导致了新的软件生态系统和新API的出现，但是它们都只不过是在原有软件上构建了更多的层而已。这样做，都是为了试图让一个触及性能极限和低功耗极限的处理器继续工作而已。现在我们需要一些新的方法。”

“在这种情况下，人们应该把注意力从在软件开发上进行修补转移到新型硬件上，只有适当的硬件才能实现真正的节能。”Menta业务开发总经理兼副总裁Yoan Dupret说。“这将最终催生具有高度灵活性的异构芯片。Tsugio Makimoto博士之前就曾经预测过，今天我们正在进入“高度灵活的超级整合”时代。”

CPU的改进

对于那些认为CPU已经走入死胡同的说法，我想引用马克吐温先生的话回怼一下：“说我已经死了的报道太夸张了。”

CPU还有若干进一步改进的路径。其中之一就是针对特定功能添加定制指令，不过这也有一定的风险。“如果器件可编程，增加了指令就意味着增加了硬件的复杂性，”GreenWaves Technologies业务开发副总裁Martin Croome警告说。“新的指令单元里的每一个晶体管都有静态泄露，如果器件有低功耗指标，情况就糟糕了，新指令单元不仅增加成本，也提高了功耗。你必须小心，看看增加新指令是否利大于弊。”

在CPU的发展历史中，新的指令单元不断被增加进来。“随着制造工艺的发展，处理器设计人员可以使用的晶体管越来越多，于是他们增加了越来越多的功能，以加速运行在其上的单线程程序。”Mentor的Klein说道。“他们添加了各种指令单元，比如预测执行、分支预测、寄存器别名等等，但是，添加新指令单元的得失对比使得这条路子越走越窄了。”

在大多数情况下，能力整合可以带来一定的好处。“在处理器件的发展历史中，我们多次看到通用CPU集成各种加速器的情形。”Arm的Whitfield解释道，“通常，我们会对架构和微体系架构进行调整，将加速度集成到通用CPU中，这方面的例子包括浮点和加密加速器。”

还有一条路径：做减法。“我们认为RISC－V这种新的方案更好，它可以帮助我们在一定程度上克服摩尔定律的放缓，”美高森美的Ruparelia说。“一种全新的、优化的架构给我们提供了更多的方法，以克服摩尔定律放缓带来的挑战。如果硅片工艺的进化停止了，就像发条被拧到了最紧一样，你必须优化所有的层面－CPU、特定域的架构、工具链，甚至编译器也要针对特定应用进行优化。”

必须根据最终产品的目标设计合适的处理器。“通过比较不同处理器的能效，算法可以在消耗最少能量的情况下在相对简单的处理器上执行，”Klein补充说。“更大的处理器可以更快地完成工作，但是它们的能效低得多。此外，在几个小型处理器中并行运行某个算法，其能效比在一个大型处理器上运行这个算法高得多。随着更多简单内核的引入，电压和时钟频率可以进一步降低，从而进一步提高能效。”

1 2 下一页>