侵权投诉
当前位置:

OFweek电子工程网

其它

正文

盘点:2016年电子行业十大新品

导读: 2016年的离去近在眼前,回首这一年,电子行业发生了太多轰动性的事件:AlphaGo战胜围棋大师李世石,让人工智能受关注度大幅度提升;华为发布麒麟960芯片,跑分超过高通骁龙821为中国芯提振士气;小米发布概念手机小米Mix,成为同质化发展的智能手机市场中的一股清流。

寒武纪科技 | 神经网络处理器 

4月末,北京中科寒武纪科技有限公司首席执行官陈天石透露,他们研发的“寒武纪”处理器正在走产业化之路,一年半左右就会进入市场。他说:“我们面向各类高能效终端芯片;面向机器人芯片,特别是服务机器人;服务民用市场和国家重大需求,比如助力信息技术企业完成智能处理任务,或用于高校和科研院所的学术研究工作等。”

盘点:2016年电子行业十大新品

寒武纪芯片和主板

寒武纪是地球生命大爆发的年代,从那时起,地球进入了生命的新纪元。

中国科学院计算技术研究所陈云霁、陈天石课题组把他们研制的深度学习处理器命名为“寒武纪”,是希望这世界上第一款模拟人类神经元和突触进行深度学习的处理器,能开启人工智能的新纪元。课题组的深度学习处理器指令集“DianNaoYu”直接面向大规模神经元和突触的处理,一条指令即可完成一组神经元的处理。

不过,寒武纪不是用来代CPU中央处理器的颠覆式革命,更像是一款针对智能认知等应用的专用芯片,优势集中在人脸识别、声音识别等人工智能方面,比如传统手机或个人电脑主板上嵌入“寒武纪”IP盒子或芯片后,将极大提高处理速度。

寒武纪系列包含以下三种原型处理器结构:

寒武纪1号(英文名DianNao,面向神经网络的原型处理器结构);

寒武纪2号(英文名DaDianNao,面向大规模神经网络);

寒武纪3号(英文名PuDianNao,面向多种机器学习算法)。

DianNao是寒武纪系列的第一个原型处理器结构,包含一个处理器核,主频为0.98GHz,峰值性能达每秒4520亿次神经网络基本运算,65nm工艺下功耗为0.485W,面积3.02mm2。在若干代表性神经网络上的实验结果表明,DianNao的平均性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级;DianNao的平均性能与主流GPGPU相当,但面积和功耗仅为主流GPGPU百分之一量级。

DianNao的核心问题是如何让有限的内存带宽喂饱运算功能部件,使得运算和访存平衡,从而达到高效能比。难点在于选取运算功能部件的数量、组织策略以及片上RAM的结构参数。由于整个结构参数空间有上千万种选择,模拟器运行速度不及真实芯片的十万分之一,不可能蛮力尝试各种可能的设计参数。为解决此问题,使用了一套基于机器学习的处理器性能建模方法,并基于该性能模型最终为DianNao选定了各项设计参数,在运算和访存间取得了平衡,显著提升了执行神经网络算法时的效能。

即便数据已经从内存取到了片上,搬运的能耗依然非常高。NVIDIA首席科学家Steve Keckler曾经指出,在40nm工艺下,将64位数据搬运20毫米所花的能耗是做64位浮点乘法的数倍。

因此,要降低处理器功耗,仅仅降低运算功耗是不够的,必须优化片上数据搬运。中科院计算所提出对神经网络进行分块处理,将不同类型的数据块存放在不同的片上RAM中,并建立理论模型来刻画RAM与RAM、RAM与运算部件、RAM与内存之间搬运次数,进而优化神经网络运算所需的数据搬运次数。相对于CPU/GPU上基于cache层次的数据搬运,DianNao可将数据搬运减少10~30倍。

盘点:2016年电子行业十大新品

(DianNao结构)

DaDianNao在DianNao的基础上进一步扩大了处理器的规模,包含16个处理器核和更大的片上存储,并支持多处理器芯片间直接高速互连,避免了高昂的内存访问开销。在28nm 工艺下,DaDianNao的主频为606MHz,面积67.7 mm2,功耗约16W。单芯片性能超过了主流GPU的21倍,而能耗仅为主流GPU的1/330。64芯片组成的高效能计算系统较主流GPU的性能提升甚至可达450倍,但总能耗仅为1/150。

虽然神经网络已成为模式识别等领域的主流算法,但用户很多时候可能倾向于使用其他一些经典的机器学习算法。

例如程序化交易中经常使用线性回归这类可解释性好、复杂度低的算法。在此背景下,寒武纪3号多用途机器学习处理器PuDianNao应运而生,当前已可支持k-最近邻、k-均值、朴素贝叶斯、线性回归、支持向量机、决策树、神经网络等近十种代表性机器学习算法。PuDianNao的主频为1GHz,峰值性能达每秒10560亿次基本操作,面积3.51mm2,功耗为0.596W(65nm工艺下)。PuDianNao运行上述机器学习算法时的平均性能与主流GPGPU相当,但面积和功耗仅为主流GPGPU百分之一量级。

<上一页  1  2  3  4  5  6  7  8  9  10  下一页>  余下全文
内容导航
声明: 本文由入驻OFweek公众平台的作者撰写,除OFweek官方账号外,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

我来说两句

(共0条评论,0人参与)

请输入评论

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码: