侵权投诉
订阅
纠错
加入自媒体

三年两代AI推理芯片,燧原科技拥有的底气是什么?

文︱郭紫文

图︱燧原科技

海量数据爆发,大数据与云计算进入发展快车道,对计算能力的需求持续提升,人工智能(AI)芯片已经成为加速产业智能化转型的硬科技。近年来,AI市场呈现爆发式增长态势,AI场景广泛落地。另一方面,AI云端市场中训练芯片和推理芯片的占比正在发生迁移,推理芯片比例逐渐提升。从IDC数据可以看出,预计到2025年,推理芯片已经占比达60.8%。“面对人工智能海量的云端推理应用,燧原科技正不断拓展和完善产品线。”燧原科技创始人兼COO张亚林表示,该公司的AI业务已经从传统单一的机器视觉、声音文字处理、决策推理等算法,转变成多场景多应用的落地,不断满足用户广泛的推理业务和市场需求。

图源:IDC

针对以上趋势,燧原科技发布了其第二代云端人工智能推理加速卡云燧i20及人工智能推理芯片邃思2.5。“随着该产品的推出,燧原科技完善了第二代训练与推理产品线,成为国内第一家拥有完整第二代训练推理产品线的企业。”张亚林表示,未来,燧原科技将会继续推动产品创新和迭代。

基于邃思DTU2.5,云燧i20以其高性能、高能效、模型覆盖面广、易部署、易运维等特点,广泛应用于计算机视觉、语音识别、自然语言处理、搜索与推荐等推理场景。与前代产品相比,云燧i20的浮点算力提升了1.8倍,整型算力提升了3倍,在存储带宽和精度等方面也有巨大的提升。与次旗舰GPU相比,云燧i20浮点算力和INT8算力提升了两倍,内存带宽增加了2.6倍。在基准测试benchmark中,云燧i20模型跨越了从图像分类识别、NLP到目标检测、图像分割,再到图像超分,整体性能提升了2.5至3.5倍。

据张亚林介绍,邃思2.5是专门为云端推理芯片和应用场景设计的架构。为了满足云端推理场景的应用落地需求,以及性价比和能效比的苛刻要求,燧原科技综合设计了算力、带宽和存储,同时对性能、功耗和成本因素进行了极致的平衡。此外,随着推理场景增多,客户对不同方向、不同类型的场景泛化性要求越来越高。燧原科技进一步打造更加泛化易用的推理软件栈,并推出增强的训推一体化系统,满足客户日益增长的需求。

邃思DTU2.5具备高性价比、高能效比、高精度等优势,全面支持从FP32、TF32、FP16、BF16到INT8的计算精度。单精度FP32峰值算力达到32 TFLOPS,单精度张量TF32峰值算力达到128 TFLOPS,整型INT8峰值算力达到256 TOPS。

图:云燧i20 vs 云燧i10

“燧原科技始终遵循‘做大芯片,拼硬科技’的使命和初心”,成立三年以来,已经完成了两代AI训练和推理产品的迭代。燧原科技拥有超级智能算力集群系统等核心产品库,包括灵活的拓扑结构、完整的部署运维、高速分布式通信和一体化训推,协助客户部署高能效、大算力、强互联、分布式的系统。在软件方面,燧原科技拥有全栈自主软件驭算TopsRider,能够广泛适配所有框架和算法,灵活扩展编译系统,高性能泛化计算库,以及高效应用工具链,为客户开发迁移、运维更多场景和应用提供可能性。

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

电子工程 猎头职位 更多
扫码关注公众号
OFweek电子工程网
获取更多精彩内容
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号