继承与发扬,Bulldozer的HT总线及内存设计
如果说Bulldozer的模块化设计和Flex FP弹性浮点单元是一种技术创新,那么Bulldozer的HT总线和内存控制器部分则是对传统的继承与发扬,技术规格没有多大变化,只是HT总线提升至3.1规范,而内存控制器最多可以支持四通道DDR3。
HT总线是AMD研发的一种高速点对点单双工数据总线,主要用于芯片级的数据传输,包括CPU与CPU、CPU与芯片组、芯片组南桥与北桥等。HT总线支持2、4、8、16和32bit等五种通道模式,并采用了DDR双倍数据传输,目前Phenom II X4 900系列使用的HT 3.0最高频率为2.6GHz,其余型号大多只有1.8-2.0GHz。
Bulldozer上将会使用最新的HT 3.1总线,最高频率提升至3.2GHz,数据传输率可达6.4GT/s,已经追平了Intel QPI总线的最高6.4GT/s速度,双向32bit通道下理论带宽可达51.2GB/s(3.2G*2*2*32/8)。
K8时代AMD将内存控制器集成在CPU内,这样可以降低读写延迟,再结合双通道模式其内存性能大幅超越当时的P4以及Core架构的C2D处理器。自Nehalem架构开始Intel也开始集成内存控制器,i7 900系列甚至支持三通道DDR3模式,Intel处理器的内存性能也逐渐甩开AMD一条街。
AIDA64记录的不同CPU平台的内存读取速度(仅供参考,内存带宽受不同配置影响较大)
从上图可以看到,当前的LGA 1155/1156处理器的内存带宽在10-15GB/s左右,而Phenom II多在8G/s上下,落后Intel相当多,只能领先Core 2级别的旧型号CPU。
这种局面有望在Bulldozer上得到改观,据目前的消息来看,16核的interlagos会支持四通道DDR3内存,而桌面级的zambezi依然是双通道DDR3,但是内存带宽会有大幅提升。首先是搭配的内存规格升级,K10时代默认支持的是双通道DDR3 1333MHz(速率1.33GT/s),Bulldozer默认支持的则是DDR3 1866MHz(1.86GT/s),双通道理论带宽为29.8GB/s,虽然暂时还没有实测内存带宽,但是Bulldozer的内存性能值得期待,至少也应该达到SNB架构的主流水准(期望如此)。
假设Bulldozer的内存性能真有如此提升,那到底是什么带来的进步呢?AMD的官方博客只说Bulldozer可以降低本地以及远程访问内存的时间,并没有详谈。对此我们只能猜测:第一是内部架构的改变,每模块有两个内核,每个内核又有2个ALU和2个AGU单元,每周期可以执行四个内存操作,高于目前的CPU水平。第二则是HT 3.1总线提高了芯片内部的传输带宽,外部的内存带宽也因此受益,第三则是支持的内存标准提高,从DDR3 1333到1866标准的提高对内存带宽提升还是很明显的。