盘点 AI 芯片2021:打破“两面墙”存算一体成趋势
作者丨张洁
【51CTO原创稿件】
新型基础设施的完善,推动了人工智能技术在消费领域以及工业生产领域的应用,落地场景趋向细分化、垂直化。当人工智能进一步发展,深度学习模型的复杂度不断增加,硬件和内存逼近临界点,CPU 这样的通用芯片无法满足人工智能任务要求时,AI 芯片应运而生。与此同时,随着智能物联时代掀开序幕,越来越多的数据开始在云、边、端流动。急剧增长的数据量对 AI 芯片的算力和功耗提出了更高要求。
AI 芯片是专门用于处理人工智能应用中大量计算任务的模块,主要分为 GPU、FPGA、ASIC。其中 GPU 主要处理图像领域的运算加速,是最先被引入深度学习的类型,技术相对成熟;FPGA 是一种可以重构电路的芯片,用户可以根据需求进行重复编程,适用于多指令和数据流的分析,性能出众但技术壁垒较高;ASIC 即专用集成电路,除了不能扩展外,在功耗、可靠性方面均有优势,可定制、低成本是其显著特点。
2021 年,全球“缺芯”潮依然未曾平复。中美两国的贸易战中,芯片是角力中的重头戏。当中国致力于在 2030 年成为人工智能产业的全球领导者时,美国自然也不会甘心于自己在技术上的头把交椅被撼动。而在 AI 芯片战场,国内外呈现出了完全不同的光景。
在“缺芯少魂”的危机意识倒逼下,中国加大自主研发力度寻求破局。BAT 互联网大厂自研 AI 芯片均已揭晓。
百度发布了自主研发的第二代昆仑 AI 芯片“昆仑芯 2”,并宣布实现量产。2 代采用 7nm 制程,通用性显著增强,可应用于互联网、智慧城市、智慧工业等领域;
阿里平头哥自研 AI 芯片含光 800 在双十一期间成为了搜索推荐等场景算力的主力,支持了淘宝搜索、推荐等业务,其中淘宝主搜 100% 的 AI 算力由该芯片提供;
腾讯在其数字生态大会上也公布了自研芯片的进展,AI 推理芯片紫霄性能目前已经流片成功并顺利点亮。
在投融资领域,国内 AI 芯片赛道也颇为热闹。超 40 家 AI 芯片企业在 2021 年拿下新融资。地平线、黑芝麻智能、燧原科技、壁仞科技、昆仑芯、摩尔线程等企业的估值均超 100 亿人民币。
相较于国内的百花齐放,国外 AI 芯片的格局要清晰得多。英伟达和英特尔依然占据了人工智能算力领域的主导位置,而率先闯进独角兽阵营的欧美 AI 芯片企业仅有 6 家,分别是获得谷歌首个 AI 芯片投资的 SambaNova Systems,将“史上最大”晶圆级芯片卖给阿联酋云计算公司的 Cerebras Systems,来自英国的 Graphcore,创始团队曾是谷歌 TPU 核心研发成员的 Groq,业界大神吉姆·凯勒的新东家 Tenstorrent 和主攻边缘 AI 芯片的以色列初创公司 Hailo。
总体来说,受益于存量需求替代以及增量需求释放,芯片行业将迎来新一轮增长契机。但目前产能不足仍是困扰全球芯片行业的主要问题。在芯片应用领域,中国是目前全球最大的芯片应用市场,但芯片自给率依然是一大挑战。放眼整个芯片市场,中国仍处于追赶阶段,还未掌握话语权。尽管现在国内的芯片厂商不少,但在制程工艺上与国际领先水准差距依然很大,此外芯片制造短板也不容忽视。
但“危机”二字本就蕴藏着“转危为机”的可能。国务院印发的《新时期促进集成电路产业和软件产业高质量发展的若干政策》表明,发展集成电路产业已经上升到国家战略高度。未来相信会有更多的资本和企业加入到芯片设计制造行列。
回顾 2021 年,值得关注的是,在 AI 芯片步入发展快车道的同时,基于下游应用的强驱动,AI 芯片的技术创新进程得到推进。其中最引人瞩目的是,曾经长期止步于理论阶段的“存算一体架构”芯片取得了较好的进展,少数企业已经有成品问世。目前来看,存算一体 AI 芯片将成为未来主流的发展方向。
为什么要发展存算一体芯片
在传统冯·诺伊曼架构下,计算和存储分离,两者间通过数据总线进行数据传输。计算单元从内存中读取数据,计算完成后存回内存。但随着 AI 芯片的发展,这种架构也成为制约计算系统性能提升的主要瓶颈之一。一方面,存储和计算之间性能不匹配的问题长期存在,存储器的数据访问速度跟不上计算单元的数据处理速度,存储器带宽在很大程度上限制了处理器的性能发挥,“存储墙”日益严重,算力提升受限;另一方面,AI 计算往往要面临海量数据,数据总线的有限带宽严重制约处理器的性能与效率,而且大量数据传输导致功耗居高不下,“功耗墙”挑战日盛。
由于两只拦路虎——“存储墙”和“功耗墙”的存在,冯·诺依曼计算架构的局限性日益凸显,因此亟需新型的计算架构应对未来应用场景的挑战。在这一背景下,存算一体的概念重新进入业界视野。
“存算一体”并非新事物,其概念的提出最早可追溯到 20 世纪 60 年代,但受限于制作成本、制作工艺及需求驱动等问题,并未掀起多大波澜。直到近年来人工智能的发展逐渐迈向正轨,存算一体才有机会崭露头角。
由于在存储单元内完成运算,这就直接解决 困扰业界许久的“存储墙”问题,减少了数据搬运过程中高达 90% 的功耗消费。同时,这种架构也减少了等待数据读取时算力的浪费,实际性能更好。这种优势被认为是解决 AI 特定场景需求的关键。
国内外在存算一体方面都还处于起步阶段,因此无论是行业龙头还是初创公司都在积极蓄力,希望在这一赛道保持领先或实现弯道超车。
国外巨头中,三星的动向值得持续关注。2021 年 2 月,三星发布了 HBM-PIM 存内计算技术,在高带宽内存 (HBM) 配置中集成内存处理 (PIM) 。这也是业界第一个 HBM 集成 AI 处理能力的芯片。据官方资料显示,与现有的内存解决方案相比,三星的 PIM 理论上可以通过可编程计算单元 (PCU) 提高 4 倍的性能。
另外,美国 AI 芯片初创公司 Myhtic 也是该领域的重要参与者。在 2021 年 C 轮融资中,Mythic 筹集 7000 万美元,自成立以来 Mythic 的总融资额已达到 1.652 亿美元。2020 年年底,Mythic 推出了其第一代 AI 芯片 M1108 AMP。与很多 AI 芯片不同,M1108 基于更加成熟的模拟计算技术,将足够的存储与大量并行计算单元打包在芯片上,以最大化内存带宽并减少数据移动的能力。
而在国内企业中,看准这一趋势的阿里巴巴落子可谓相当果断。2021 年 12 月,达摩院宣布成功研发新型存算一体架构芯片,该芯片是全球首款基于 DRAM 的 3D 键合堆叠存算一体 AI 芯片。
除了阿里外,众多初创公司也开始在这个赛道发力,知存科技、后摩智能、九天睿芯等皆是个中翘楚。
成立于 2017 年的知存科技推出了国际首个存算一体加速器 WTM1001 和首个存算一体 SoC 芯片 WTM2101。截止 2021 年,知存科技已完成累计近 3 亿元的 A 轮系列融资。
后摩智能作为国内首家采用存算一体技术打造大算力芯片的公司,其愿景也十分清晰:打造出具有“十倍效应”的 AI 芯片, 致力于满足真正人工智能时代的超大算力需求。
九天睿芯成立于 2018 年,专注于神经拟态感存算一体芯片研发。2021 年,九天睿芯已设计出基于 SRAM 的感存算一体架构芯片 ADA20X,可广泛应用于多种视觉场景。
当前,存算一体芯片聚焦于低延迟、低功耗、高算力需求的边缘计算,主要应用于音频类、健康类及低功耗视觉端侧应用场景中。随着 AI 应用日益丰富,在推进规模化应用阶段,终端厂商必然会关注成本问题,而成本和功耗有着直接的关系,低功耗的 AI 芯片往往意味着它能够实现整机低成本。这对于存算一体芯片来说无疑是一片蓝海。
任何一项技术都不是“万金油”,存算一体亦然,它只针对某一类计算特别是以数据为主的 AI 计算,并不适合 CPU 等以控制为主的计算。而且这种架构正处于学术界向工业界迁移的关键时期,要真正实现转化成功,一方面要求对存算一体技术有深刻的洞察,另一方面也要对 AI 应用落地有透彻的理解,两者相结合才可能发生质变,取得实质性突破。
此外,存算一体作为新的芯片方向,还面临电路设计、架构、软件等诸多层面的挑战。由于存算一体芯片和常规的芯片设计方案不同,目前市面上也没有成熟的专用 EDA 工具辅助设计和仿真验证;芯片流片之后,没有成熟的工具协助测试;在芯片落地应用阶段,也缺乏专用的软件与之适配。如何完善重要技术的生态链,是行业上下游厂商应该共同考虑的问题。
“时势造英雄。”每一次计算构架的大变革都会创造一个新的王者。从主机时代的 IBM、PC 时代的英特尔、移动时代的高通,现在进入智能物联网的时代,问芯片天下,谁主沉浮?我们拭目以待。
来源:51CTO张洁
图片新闻
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
11月29日立即预约>> 【上海线下】设计,易如反掌—Creo 11发布巡展
-
11月30日立即试用>> 【有奖试用】爱德克IDEC-九大王牌安全产品
-
即日-12.5立即观看>> 松下新能源中国布局:锂一次电池新品介绍
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论