算力+带宽需求攀升,Graphcore全力以赴全新架构AI芯片
机器智能标志着一个新的计算时代的开始,这个时代需要一种从根本上不同于以往的处理器和软件工具。这个迅速增长的新市场为Graphcore创造了打造一家大型全球科技公司的机会。
基于AI算法的更大需求
众所周知,使用AI算法的公司通常会选择使用GPU,而机器学习算法需要快速处理海量数据,这使得企业对硬件的需求日益攀升。
与传统处理器不同,Graphcore所设计的这款芯片是专为机器学习系统打造,这种芯片可以部署于各种机器学习的应用,例如联网设备、自动驾驶、云计算以及机器人等领域,他们相信越来越多的企业将使用这些技术。
芯片产业链复杂,从技术研发、产品迭代及资金链需求角度而言,初创公司的成长挑战都是巨大的。尽管如此,Graphcore还是迅速打开了行业知名度,原因之一离不开英国产业市场的特殊性。
在这样的大环境下,Graphcore想要在AI硬件这个快速发展的行业中对标巨头英特尔和英伟达,成长为一个英国本土大型上市企业,并且不会出售给竞争对手。
根据IDC数据预测,认知和人工智能系统在2017年全球收入将达到125亿美元,并预计在2020年增长到460亿美元。投资者之所以纷纷押注芯片制造商,也是因为这项技术是这一增长趋势背后最为重要基础支持。
Graphcore的诞生和目标
与一般的新锐公司不同,Graphcore在人工智能学习的反应速度以及低能耗方面,其开发的产品要比目前市场上所有的图像处理解决方案好10到100倍。
Graphcore成立于2016年,其总部位于英国布里斯托,两位联合创始人Nigel Toon、Simons Knowles此前还共同创立过市值4.35亿美金的3G蜂窝芯片公司Icera,后卖给英伟达。
Graphcore频受资本和学界青睐,主要来自于其核心产品一款名为IPU的AI芯片,与常见的IPU(ImageProcessingUnit,图像处理器)不同,其IPU主要应用于无人驾驶汽车和云计算,专门为强大的机器习得系统设计。
此外还开发了一套可以帮助用户无缝使用TensorFlow和MXNet等机器学习框架的接口,并为此提供了一个包含工具、驱动和应用库的开源软件框架Poplar。
总的来说,Graphcore认为先做Training然后做Inference的机制,未来一定会被Learning取代,即未来理想的人工智能应该能够在部署之后还能保持持续的学习和进化。
市场看好融资多轮顺畅
自创立以来,Graphcore就吸收了不少战略投资方,其中A轮包括三星和博世,以及该轮融资中的宝马和微软。
在2017年初,Graphcore完成的3000万美元融资就备受关注,因为这次投资方里包括了三星集团、德国汽车巨头Bosch以及Arm创始人HermannHauser,还吸引了DeepMind联合创始人DemisHassabis、Uber首席科学家ZoubinGhahramani以及AtomicoandDellTechnologiesCapital的投资。
2017年10月,Graphcore接受了红杉资本5千万美元的投资,这是最近成为风险投资新宠的AI芯片公司之一。
2018年12月,英国AI芯片公司Graphcore宣布完成新一轮2亿美元融资,宝马旗下风投公司iVentures和微软作为战略投资方加入,公司估值达到17亿美元。这样一来,其融资总额超过3亿美元。
本轮融资为Graphcore的D轮融资,在最近一个月里敲定,新晋投资人和早期投资人各占一半金额。由其早期投资人Skype创始人NiklasZennstrm'sAtomico以及欧洲大型投资公司Sofina领投。宝马iVentures和微软、美利安全球投资者均是该轮融资的新晋投资方。
合理的推测是,博世和宝马将为Graphcore推进自动驾驶和车联网市场提供便利,而三星则是手机和语音助手领域的窗口,戴尔还将为其提供云计算芯片市场的DOE和渠道资源。
此外,罗伯特博世风险投资公司、C4风险投资公司、戴尔科技资本、以色列最大风投Pitango、三星和红杉资本等跟投。
IPU的核心特征及难点
根据公开资料显示,GraphcoreIPU的一些关键特征包括:
①同时支持Training和Inference。
②采用同构多核(many-core)架构,超过1000个独立的处理器。每个处理器核的处理能力和具体支持的操作还不清楚。支持all-to-all的核间通信,采用Bulk Synchronous Parallel的同步计算模型。
③采用大量片上memory,不直接连接DRAM,这可能是他们的架构中最激进的一个选择。
Graphcore IPU的多功能性,即支持多种机器学习技术的高效表现适合各种应用,无论是智能语音助手还是自动驾驶车辆。因为GraphcoreIPU的灵活性,能够在数据中心和车辆中使用相同的处理器,以减少用户的开发时间和工作量。
此外,Graphcore IPU的规模很大,通常包括数千到数百万个顶点,这也意味着巨大的并行性。同时IPU是稀疏的,大多数顶点只连接到其他一小部分顶点,即低精度。
对于新架构,几乎Graphcore运行神经网络模型的所有计算机系统,甚至包括Google的特殊硬件,都使用RAM存储。从RAM中获取神经网络的权重需要耗费大量的计算资源,所以处理器可以帮忙解决。
在Graphcore的芯片上,权重存储在处理器中的高速缓存中,而不是存储在RAM中,也不需要移动,因此,事情就变得比较简单了。可能我们会得到一个系统,比如一万亿个权重。
与微软戴尔的紧密合作
11月18日至22日,Graphcore在美国丹佛举办的SC19上展示与微软最新联合发布的微软Azure上GraphcoreIPU相关产品与介绍,并提供相关的注册信息。
另外,使用了Graphcore第一个IPU技术的戴尔易安信DSS8440也将首次对外展示。
微软和Graphcore的开发人员使用BERT语言模型实现了最先进的性能和准确性,仅用一个IPU服务器系统和8个C2IPU处理器PCIe卡就可以在56个小时内训练BERTBase。通过BERT推理,吞吐量提高了3倍,延迟改善了20%以上,从而可以更快地交付结果。
微软和Graphcore已经紧密合作了两年多。就在11月14日,Graphcore宣布了与微软的具体合作内容,并正式发布MicrosoftAzure上Graphcore智能处理单元(IPU)的预览版。这是重大公有云供应商首次提供Grapchore IPU,这些IPU从构建之初便旨在支持下一代机器学习。
其强大的并行处理能力实现了快速训练模型并进行超低延时运行,这也使的Graphcore能够在自然语言处理以及在理解自动驾驶视频方面取得重大进展。因此,IPU强大的并行处理能力是我们区别于其他处理器的一个重要因素。
Graphcore还将与戴尔公司一起展示第一个IPU技术,该技术旨在满足企业客户构建本地机器智能计算的需求。在戴尔公司的DellEMCDSS8440是一款采用Graphcore技术的机器学习服务器。
该系统使用8个GraphcoreC2IPU处理器PCIe卡提供1.6PetaFlops的机器智能计算,每个卡有2个IPU处理器,所有卡都在标准4U机箱中与高速IPU-Link技术连接。
这个全新的芯片速度会非常快,可以支撑很多不同的神经系统,拥有极高的扩展性。Arm联合创始人甚至把Graphcore IPU成为芯片产业的第三次革命。
结尾:
随着人工智能对芯片算力和带宽的需求越来越高,现在大多数的ASIC AI芯片并不能满足当下的需求。为此打造一个全新架构的AI芯片就成为迫切需求,这也正是Graphcore IPU正在做的事情。
图片新闻
最新活动更多
-
即日-11.13立即报名>>> 【在线会议】多物理场仿真助跑新能源汽车
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
11月29日立即预约>> 【上海线下】设计,易如反掌—Creo 11发布巡展
-
11月30日立即试用>> 【有奖试用】爱德克IDEC-九大王牌安全产品
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论