索尼本周公布了PS4的更多架构技术细节,并宣称其中的半定制AMD APU处理器具备大量增强以获得性能的最大化,同时也简化了同时使用x86 CPU、GPU进行开发的难度。
PS4的处理器整合了八个AMD x86美洲虎架构的CPU核心,十八组AMD GCN架构的GPU计算单元,总计1152个流处理器,浮点性能1.84TFlops,并搭配多通道的256-bit 8GB GDDR5统一显存/内存。
PS4首席架构师Mark Cerny在接受采访时称:“我们的总体目标就是全方位地将计算和图形融合在一起,让开发社区懂得,在他们进行大量异步计算的时候需要用到哪一个。”
根据索尼的说法,PS4 APU的主要增强有:
1、GPU可以直接写入系统内存,而无需经过一级、二级缓存,从而大大简化CPU、GPU之间的数据同步。Mark Cerny声称这种直接读写使用了一条独特的总线,带宽约20GB/s。
2、为了支持开发人员将GPU二级缓存同时用于图形处理和异步计算,索尼还在缓存段标记里增加了一个“易变位”(volatile bit)。
这样一来,开发人员就可以选择性地将所有的计算访问标记为易变,然后在计算从系统内存中进行读取的时候,就不必考虑二级缓存里使用的相应缓存段,然后在写回结果的时候,又可以写回所使用的缓存段。这能让开发人员继续使用GPU二级缓存执行所需操作,同时不会对正在执行的图形操作产生明显影响,避免GPU上计算操作、图形操作的重叠。
3、AMD GCN架构原本仅支持一路图形指令、两路计算指令,而索尼与AMD合作,PS4上将计算指令放宽到了64路。如果游戏开发者需要一些异步计算,就可以将其放在这64路指令的一路中,然后就会有多级硬件仲裁来决定它如何运行、何时运行,并且做到和图形操作同步。
索尼认为,不仅仅是游戏,很多中间件也会用到GPU计算,所以来自不同软件客户端的请求需要正确地放在一起并按顺序执行。
Mark Cerny还吊了下大家的胃口:“虽然现在不能明说,但是PS4的首发游戏阵容绝对会比PlaySation历史上任何一次都更加强大。”