作为对ARM Mali-T800系列的直接回应,Imagination今天正式发布了新一代移动GPU PowerVR Series7系列,包括高端7XT、低端7XE两个子系列。
下边,我们就细细看看它的底层架构设计,并预览一下性能。
【PowerVR 7架构解析】
本质上来说,PowerVR 7的架构还是“Rogue”,已经引入两年。该架构有着先进的着色器流水线体系,没什么明显缺点,短期内还无需彻底翻新,只要局部增强、完善就可以提升效率和性能了,包括强化指令集。
当然,它还需要不断加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支持了,但是苹果的Metal来势汹汹,作为回击的Google Android Extension Pack现在是不能少的,还加入了可选项Direct3D 11.1(通俗地说就是DX11.1)。
但是注意7XT上这两个都是标配,7XE上的AEP只是可选项,Direct3D则只到10.0。
这次唯一增加的新模块就是“曲面细分协处理器”(Tessellation Co-Processor),可配合顶点数据管理器(Vertex Data Master)实现完整的曲面细分支持,但注意为了节省功耗,它是个固定功能单元,不可编程。
曲面细分、ATSC纹理压缩、几何着色、纹理着色,这些就是支持AEP的基础。
其他模块没有大变但都有所增强,比如说顶点数据管理器(几何前端)的几何性能翻了一番,计算数据管理器(Compute Data Master)则提速了最多三倍,尤其适合处理大量的小内核。
粗纹理调度器(Coarse Grain Scheduler)降低了内部区块关联性,可以更快地向空闲核心(着色器簇/USC)发送指令,而不必等待其他核心完成工作。
USC核心本身变动很小,FP16/FP32 ALU、浮点单元都没变,但是特殊功能单元(SFU)有了两处明显变化。首先也是最重要的,SFU可以原生处理FP16、FP32操作了(上代会全部推给FP32),因此在处理FP16数据集的时候不必进行无谓的高精度操作,自然能节省功耗,而且因为SFU本身已经很大了,原生FP16带来的功耗节约会很明显。
另外虽未明说,但极有可能FP16、FP32 SFU单元已经分离成了独立的两个(架构图显示一个),当然即便如此它们也不能同时使用。
第二个增强是SFU操作可以和ALU操作并发了,也就意味着两个单元可以同时工作。Imagination表示,SFU代码比预期得来得更快,因此并发会大大提高性能,为此指令集也做了相应的扩展。
此外,PowerVR 7系列还可选支持FP64操作,按照设计每核心有一个FP64 ALU。
最后是个非图形功能,硬件加密区,使用虚拟化技术创建最多8个区域,彼此完全隔离,可进行不同的安全操作,并与CPU、GPU互联。7XT会标配它,7XE上则是可选。
CPU上早就有了类似的功能,GPU上则一直是软件模拟,效率低下,而且安全性不足。