侵权投诉
订阅
纠错
加入自媒体

深度解析计算机架构未来发展趋势和愿景

2017-07-26 09:33
小伊琳
关注

垂直化趋势

三维(3D)集成提供了一个新的可扩展维度。

摩尔定律终结的重要后果是使得芯片设计师再也不能“无偿地”每18个月将自己设计中的晶体管数量提高一倍。与此同时,最近几代芯片中,相对于计算,驱动全局总线开销的增长很快,因此不断提升了互联在芯片功耗预算中所占比例。

3D集成为芯片设计提供了一个新的扩展维度,尽管摩尔定律终结了,仍然可以在一个单系统上集成更多的晶体管,可以从3个维度缩减互联开销,并实现各种混合制造技术的紧密集成。因此,3D集成使3D结构内部的系统组件具有更高的能效、更宽的带宽和更低的延迟。

从架构上来讲,3D集成也说明平衡系统的计算必须尽量靠近数据。尽管闪存和其他内存设备早已通过3D方式进行容量扩展,但将内存设备与高性能逻辑集成的尝试才刚刚开始。例如,美光(Micron)公司推出的混合内存立方体(Hybrid Memory Cube),实现了快速逻辑和密度内存的3D堆叠,为学术界重新刮起“近数据计算”(near-data computing, NDC)和“内存处理”(processing-in-memory, PIM)架构的学术研究风潮。尽管这个研究问题早在20年前已相当流行,但受限于当时的工艺技术,PIM架构并没有进一步实现商业应用。近几年,随着实用芯片堆叠和多技术垂直集成技术的出现,这些架构成为提升扩展性的有效途径。

尽管3D集成为芯片设计赋予了新能力,但同时也在实现高可靠性和高收益方面提出许多复杂的新挑战,其中高可靠性和高收益可以通过架构支持解决。比如,3D集成内存启发我们重新思考传统内存和存储架构。3D集成也对功率和温度管理引入了全新的问题,这是由于传统的散热技术不足以应对高性能集成设计带来的功率密度提升。这些问题和挑战开启了全新的、丰富的体系架构创新的可能性。

体系结构“更接近物理层”

经典缩放定律的终结,给计算机底层架构带来更多的本质变化。

新的器件技术和电路设计技术历来引发新结构的产生。未来有若干可能的情况给计算机体系结构带来深远的影响。这些情况分为两大类。第一类是通过更有效的信息编码,更接近模拟信号,来更好地利用目前的材料和器件。对模拟计算的关注再次兴起,因为它很适合需要控制准确度的应用。而且和数字信息处理相比,模拟信息处理通过把信息更密集地映射到模拟信号上,以及更高效的功能单元,能够保证功耗更低。然而,这类计算更易受到噪声影响,需要有新的容错方法才能实际应用。

第二类机会是“新”材料的使用,包括更高效的交换、更密集的布局和独特的计算模型。下面我们列出一些值得体系结构领域注意的努力方向。

新的存储器件。几十年来,数据一直存储在动态随机存取存储器(DRAM)、闪存或磁盘上。但是,新的存储器件(例如Intel/Micron 3D XPoint存储器)正在进入商用化,与传统存储层次部件相比,这些新器件在开销、密度、延迟、吞吐量、可靠性和寿命等方面完全不同。

碳纳米管。基于碳纳米管(CNTs)的电子学研究持续取得显著进展,最近的结果表明,只使用碳纳米管搭建出一个简单的微处理器是可行的。碳纳米管可以保证更高的密度和更低的功耗,并且可用在三维基底上。这使得碳纳米管成为体系结构方案是非常可行的。

量子计算。量子计算利用量子力学现象存储和操纵信息。它的主要优点是,“叠加”量子现象有效地允许同时表达0和1状态,这使得量子计算实现选择算法时比传统计算有了指数级加速。

超导逻辑。量子计算的一个姊妹方向是超导逻辑,使用约瑟夫森结等超导器件的系统,能够提供“免费”的通信,因为在超导线上传输信号几乎不消耗能量。另一方面,在数据操作上比传输数据有更高的能耗。这些权衡与CMOS硅电路正好相反,在CMOS电路上大部分能量消耗在通信而不是数据操作。

微软、谷歌、IBM和I-ARPA等公司和机构都已经宣布在量子计算和超导逻辑进行了大量投资。我们认为量子计算机结构得到再次关注的时机是成熟的,量子计算在十年内可能会产生实际影响。

借鉴生物学。利用生物学基底做计算很早就想到了,有可能实现。DNA计算已经演示了简单的逻辑操作,最近的许多结果也表明DNA作为档案存储器和纳米结构自组装的数字媒介具备潜力。对研究人员来说,生物科技产业推动的DNA操纵技术所取得的进展使得体系结构研究人员认为,使用生物是可行的。除了DNA,还有诸如蛋白质等其他生物分子能够用于计算,这些生物分子工程在过去十年进步显著。

机器学习作为核心负载

机器学习正在改变我们实现应用的方式。硬件性能提升使得机器学习应用于大数据成为可能

机器学习在过去十年中取得了长足的进步,产生了很多长期以来只存在于科幻小说里的应用。可以说,这一进步在很大程度上受益于丰富的数据和强大的计算能力。大规模机器学习应用也促进了存储系统和专用硬件(GPU, TPU)等的设计。

尽管目前的重点是支持云端的机器学习,但是在诸如智能手机和超低功耗传感器节点等低功耗设备中支持机器学习应用也有非常重要的机会。幸运的是,许多机器学习内核具有相对规整的结构,能够在准确率和资源需求之间进行权衡。因此,它们适用于专用硬件、重构和近似计算等技术,为体系结构的创新开启了新空间。

机器学习从业者在计算上花费相当长的时间用于模型训练。即便使用超大规模的计算集群,花费一星期到一个月来训练一个模型也是普遍的。虽然这样的计算资源投资能够分摊到对模型多次调用,但模型较长的更新迭代周期可能会对用户体验产生负面影响。因此,对体系结构研究人员来说,设计能更好地支持机器学习模型训练的系统是一个新的机遇。

<上一页  1  2  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

电子工程 猎头职位 更多
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号