推土机、打桩机、压路机、挖掘机……AMD CPU架构这一步步走下来颇为艰难,每一代的进步其实都是很明显的,只是无奈底子太薄。不得已之下,AMD甚至放弃了在FX、Opteron独立处理器中使用新架构,仅将新的压路机用在Kaveri APU之中,终极版挖掘机的前景也很难预料。
ISSCC 2014国际固态电路会议上,AMD又向业内人士介绍了他们的压路机。
压路机的一个模块和概况:首次使用28nm Bulk CMOS制造工艺(不是SOI),12个金属层,2.36亿个晶体管,面积29.47平方毫米(加上二级缓存40.33平方毫米),运行电压0.7-1.35V。
宣称IPC(每时钟周期指令数)提升了14.5%,同时在3GHz频率下功耗降低了38%,不过奇怪的是,实际产品的频率明明降低了(工艺限制),这里却来了个“+500MHz”。在场的都是专家,就不用这样了吧。
这是压路机、打桩机架构改进的主要地方,包含12个方面,还是非常全面的,特别是前端和缓存做了大幅度的增强:每模块内指令解码器增至两个,每个整数核心都可以独享一个;每个执行单元的浮点单元流水线从3条增至4条(每模块8条);一级指令缓存增至三路关联96KB,二级缓存容量支持基于电源栅极的动态控制。
此外还有执行单元部分的多方面优化,包括微操作分派请求、载入请求、存储请求、探测缓冲、整数物理寄存器文件、整数调度器、浮点物理寄存器等等。
延伸阅读——AMD压路机架构预览:也许会有惊喜发生