美国加州帕洛阿尔托市举行的第22届Hot Chips高性能芯片大会上,AMD如约公布了“推土机”(Bulldozer)、“山猫”(Bobcat)两款全新处理器架构的更多技术细节。AMD院士兼推土机总设计师Mike Butler、AMD院士兼山猫总设计师Brad Burgess均出席会议并分别发表了相关演讲。
推土机架构主攻性能和扩展性,面向主流客户端和服务器领域,山猫架构的重点则是灵活性、低功耗和小尺寸,将用于低功耗设备、小型设备、云客户端。
推土机将采用新的模块化设计,每个模块拥有两个四管线核心,彼此共享一个浮点调度器和两个128位乘法累加单元(FMAC)。两个核心都拥有自己的整数调度器、一级数据缓存,并预取、解码单元和二级缓存。 新架构还将有全新的x86指令集支持,包括SSE4.1、SSE4.2、AVX、XOP。
因为除了高性能计算领域之外浮点运算量并不多,这种浮点调度器共享设计能大大节省晶体管、核心面积、功耗,降低成本;两个FMAC单元既可以被每个核心单独使用,也可以合并组成一个256位FMAC单元,当然这需要程序代码做相应改变。为了获得最大程度的性能功耗比,推土机架构还会在共享、专用单元之间动态切换。
AMD宣称,这种共享模块化设计的多线程执行效率要大大优于同步多线程(SMT)和芯片多处理(CMP)。SMT最典型的实例就是Intel的超线程技术,它强制两个线程进入一个核心,线程之间会争夺资源,影响效率;CMP则是一个线程对应多个专用核心,浪费资源。