侵权投诉
订阅
纠错
加入自媒体

2019年AI芯片产业深度研究报告

2019-07-02 09:28
来源: 芯智讯

image.png

一、 人工智能芯片发展现状及趋势

1、深度学习算法对芯片要求更为苛刻,通用 CPU 性价比相对较差

经历了 60 多年的起起伏伏之后,人工智能终于迎来了第三次爆发。第三次爆发的核心引爆点是深度学习算法的出现,但其背后的支撑是数据和算力。对整个 AI 行业来讲,算法、数据和算力三大基本要素中,数据尤其是海量数据的获取和处理难度在下降,算法也在深度学习模型的基础上不断优化,而负责将数据和深度算法统一协调起来的芯片能否获得大的飞跃,成为市场关注的焦点。

image.png

image.png

深度学习算法对芯片性能需求主要表现在三个方面:一、海量数据在计算和存储单元之间的高速通信需求。这不但需要芯片具备强大的缓存和片上存储能力,而且还需要计算和存储单元之间有较大的通信带宽。二、专用计算能力需求高。深度学习算法中有大量卷积、残差网络、全连接等特殊计算需要处理,还需要提升运算速度,降低功耗。三、海量数据自身处理同样也对芯片提出了新的要求,尤其是非结构化数据的增多,对传统芯片结构造成了较大的压力。

通用 CPU 在深度学习中可用但效率较低。比如在图像处理领域,主要用到的是 CNN(卷积神经网络),在自然语言识别、语音处理等领域,主要用到的是 RNN(循环神经网络),虽然这两种算法模型有着较大的区别,但本质上都是向量和矩阵运算,主要是加法和乘法,辅助一些除法和指数运算。传统 CPU 可用于做上述运算,但是 CPU 还有大量的计算逻辑控制单元,这些单元在 AI 计算中是用不上的,造成了 CPU 在 AI 计算中的性价比较低。

image.png

2、GPU、FPGA 以及 ASIC 各有优劣,成为当前 AI 芯片行业的主流

正因为 CPU 在 AI 计算上的弱点,给了可以实现海量并行计算且能够对进行计算加速的 AI 芯片留下了市场空间。从广义上讲,面向 AI 计算的芯片都可以称为 AI 芯片,包括基于传统架构的 GPU、FPGA以及 ASIC(专用芯片),也包括正在研究但离商用还有较大差距的类脑芯片、可重构 AI 芯片等。

云端训练芯片市场较为集中,而推理市场云、边两端均有大量企业参与

按照部署位置划分,AI 芯片可以分为云端芯片和边缘端芯片。云端芯片部署位置包括公有云、私有云或者混合云等基础设施,主要用于处理海量数据和大规模计算,而且还要能够支持语音、图片、视频等非结构化应用的计算和传输,一般情况下都是用多个处理器并行完成相关任务;边缘端 AI 芯片主要应用于嵌入式、移动终端等领域,如摄像头、智能手机、边缘服务器、工控设备等,此类芯片一般体积小、耗电低,性能要求略低,一般只需具备一两种 AI 能力。

按照承担的任务分,AI 芯片可以划分为训练芯片和推理芯片。训练是指通过大量标记过的数据在平台上进行“学习”,并形成具备特定功能的神经网络模型;推理则是利用已经训练好的模型输入新数据通过计算得到各种结论。训练芯片对算力、精度要求非常之高,而且还需要具备一定的通用性,以适应多种算法的训练;推理芯片更加注重综合能力,包括算力能耗、时延、成本等因素。

综合来看,训练芯片由于对算力的特殊要求,只适合在云端部署,而且多采用的是“CPU 加速芯片”类似的异构模式,加速芯片可以是 GPU,也可以是 FPGA 或者是 ASIC 专用芯片。AI 训练芯片市场集中度高,英伟达和谷歌领先,英特尔和 AMD 正在积极切入。推理在云端和终端都可进行,市场门槛相对较低,市场参与者较多。云端推理芯片除了传统的英伟达、谷歌、赛灵思等芯片大厂外,Groq等国际新兴力量也在加入竞争,国内寒武纪、比特大陆也有不错表现;终端推理芯片市场较为分散,场景各异,参与者除了英伟达、英特尔、ARM 和高通之外,国内企业如寒武纪、地平线、云知声、云天励飞等在各自细分领域均有所建树。

image.png

image.png

GPU 擅长云端训练,但需与 CPU 异构、功耗高且推理效率一般

GPU(Graphics Processing Unit)是一种由大量核心组成的大规模并行计算架构,专为同时处理多重任务而设计的芯片。正是由于其具备良好的矩阵计算能力和并行计算优势,最早被用于 AI 计算,并在云端获得大量应用。GPU 中超过 80%部分为运算单元(ALU),而 CPU 仅有 20%,因此 GPU更擅长于大规模并行运算。以英伟达的 GPU TITAN X 为例,该产品在深度学习中所需训练时间只有CPU 的 1/10 不到。但 GPU 用于云端训练也有短板,GPU 需要同 CPU 进行异构,通过 CPU 调用才能工作,而且本身功耗非常高。同时,GPU 在推理方面需要对单项输入进行处理时,并行计算的优势未必能够得到很好的发挥,会出现较多的资源浪费。

image.png

▲CPU与GPU架构对比

image.png

FPGA 芯片算力强、灵活度高,但技术难度大国内差距较为明显

FPGA(Field-Programmable Gate Array)即现场可编程门阵列,该芯片集成了大量的基本门电路以及存储器,其灵活性介于 CPU、GPU 等通用处理器和专用集成电路 ASIC 之间,在硬件固定之前,允许使用者灵活使用软件进行编程。FPGA 在出厂时是“万能芯片”,用户可根据自身需求,用硬件描述语言对 FPGA 的硬件电路进行设计;每完成一次烧录,FPGA 内部的硬件电路就有了确定的连接方式,具有了一定的功能;输入的数据只需要依次经过各个门电路,就可以得到输出结果。

1  2  3  4  5  6  下一页>  
声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号