等你24年了!Intel Arc锐炫独立显卡深入解读:化腐朽为神奇
【XeSS:化腐朽为神奇的超分辨率缩放】
针对矩阵引擎不同指令的处理操作,Intel也做了详细的解释,我们来简单了解下。
MAC作为图形渲染中的基本SIMD矢量指令,也是Xe矢量引擎的核心,可以执行8次并行乘法,然后执行8次并行加法,每个时钟周期就是16个操作。
上图最左侧水平方向的前排、后排蓝色方块,就代表操作数,上下的方框则代表累积的源和结果。
DP4a指令是针对不需要32位精度的AI计算所做的优化,工作原理是将所有32位输入分成8位块,然后独立执行,总共32次并行乘法(紫色方块),每个时钟周期就是64个操作,相比标准SIMD MAC提高了4倍。
XMX指令也是每个操作分成4个块,然后独立相乘、累加,共有64个操作,每个时钟周期4个阶段就是256个操作,由此带来16倍的算力提升。
XMX矩阵引擎最直接的作用就是支撑XeSS超采样抗锯齿技术,类似NVIDIA DLSS、AMD FSR,可以通过低分辨率渲染、高分辨率缩放输出,提升游戏性能,并得到类似或超越原生的画质。
XeSS已经得到了十多款游戏的支持,不过目前还不可用,会在今年初夏正式面世。
下边感受一下XeSS在实际游戏中的效果,左侧是1080p原生渲染,右侧是4K XeSS缩放渲染,可以明显看到后者的画面质量高得多,细节也更加丰富、锐利。
至于性能提升幅度,Intel暂时没有给出具体数据。
图片新闻
技术文库
最新活动更多
-
即日-12.26立即报名>>> 【在线会议】村田用于AR/VR设计开发解决方案
-
1月8日火热报名中>> Allegro助力汽车电气化和底盘解决方案优化在线研讨会
-
1月9日立即预约>>> 【直播】ADI电能计量方案:新一代直流表、EV充电器和S级电能表
-
即日-1.14火热报名中>> OFweek2025中国智造CIO在线峰会
-
即日-1.20限时下载>>> 爱德克(IDEC)设备及工业现场安全解决方案
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论