当地时间11月11日,AMD在总部加州山景城召开了2009年度分析师会议,公司高管集体出席,详细介绍了AMD在未来2010-2111年期间的发展规划,其中大量技术细节都是第一次公布,这里我们就一一为大家进行介绍。
首先从服务器开始,因为最新技术往往都会首先出现在这一领域,比如流传已久、备受期待的AMD全新一代处理器架构“推土机”(Bulldozer)。
其实在应用全新架构之前,AMD就已经在转变服务器策略,将整个服务器市场划分为两大部分:Opteron 4000系列面向单路和双路市场,主打高能效和成本优化,其中Opteron 4100明年第二季度发布;Opteron 6000系列面向双路和四路/八路市场,适合追求高性能和扩展性的客户,其中Opteron 6100系列明年第一季度发布。
据市调机构IDC统计,单路、双路、四路/八路平台分别占整个市场的20%、75%和5%。
Opteron 4000系列采用Socket C32插槽,仍为LGA封装和1207个引脚,间距1.1毫米,面积285平方毫米。新插槽是在现有Socket F 1207的基础上重新分配、优化引脚而来的,可以支持DDR3内存以及更大的容量、更高的频率。
具体产品方面首先是“圣马力诺”(San Marino)平台,其中芯片组是AMD SR56x0+SP5100,支持高级平台管理(APM)技术,处理器是“里斯本”(Lisbon),45nm工艺,核心数四个和六个,平均功耗75/55/40W不等,6MB三级缓存,两条16-bit HT3总线,每连接最高带宽6.4GT/s,支持双通道标准版U/RDDR3和低压版LV RDDR3内存,每通道两条、每处理器四条,拥有CoolSpeed/C1E/CoolCore/Enchanced PowerNow!节能、HT Assist优化、AMD-V虚拟化等一系列技术。
同时还会有个超低功耗平台“阿德莱德”(澳大利亚/Adelaide),平均处理器功耗只有35W,平均每个核心还不到6W,搭配AMD SR5650+SP5100芯片组,支持LV DDR3低压内存,但仅支持HT1总线。
到2011年,处理器升级为“巴伦西亚”(Valencia),迎来32nm工艺和新架构推土机,核心数增加到六个和八个,芯片组不变,插槽也沿用Socket C32以保证兼容升级。新架构详情稍后介绍。
芯片组方面再说一句,SR5690用于高I/O系统,SR5670面向可扩展中小型企业(SMB),SR5650则重点针对高能效,特别是云计算领域。
Opteron 6000系列则是Socket G34插槽,也是在现有Socket F 1207基础上改变而来,支持DDR3内存,但具体细节暂未披露。
产品上首先是“马拉内罗”(Maranello)平台,芯片组也是SR56x0+SP5100,支持AMD-Vi虚拟化技术和PCI-E 2.0总线技术,处理器代号“马尼库尔”(Magny-Cours),45nm工艺,八核心和十二核心,基于DAC 2.0架构,也就是双四核和双六核封装在一起并通过HT3总线互连,因此拥有12MB三级缓存、四条HT3总线和四通道DDR3内存,每通道三条、每处理器十二条,其他上述技术也一应俱全。
到2011年处理器升级为“英特拉格斯”(Interlagos),也是32nm工艺和推土机架构,核心数量十二个和十六个。同时因为主攻高性能,Opteron 6000系列没有节能版本。
Opteron 4000/6000虽然是两个不同系列产品,但相通之处也很多,比如平台接口、芯片组和南桥、BIOS基础代码、编程接口、驱动程序等都是一致的,划分成两个系列只是出于市场策略的不同而已。
下边就谈谈大家颇为关注的全新高性能架构“推土机”。它将成为现在K10 Stars之后AMD众多产品的基石,包括主流服务器、台式机和笔记本等,最核心的变革就是采用了一种新的多线程计算模式来提高效率和吞吐量(基本上可以看作是传说中的逆向超线程)。在低价低功耗、超轻薄PC方面AMD另有一个新架构“山猫”(Bobcat),核心就是集成GPU的加速处理单元APU,这个之后再说。
推土机当然也是x86架构,号称是“一个能够大幅减少线程串扰(thread-interference)的革命性新架构”,同时也是“一个模块化架构”,类似Intel Nehalem,可以根据需要添加或删减各种模块,从而获得不同规格的产品。
根据新架构设计,每两个核心紧密联系组成一个单独单元,获得两个并行线程,这就是新架构处理器的基础模块(也就是说没有单核心了),可以在两个独立、非共享的核心上执行两个线程,而且不存在任何瓶颈。
这两个核心各自拥有自己的一级缓存,并共享二级缓存和预取、解码单元,然后所有核心与集成的北桥模块共享三级缓存。
新架构中还有一个弹性浮点单元,包括一个浮点调度器和两个128-bit FAMC,每个时钟循环中都可以在两个处理器核心之间单独或共享使用。
除了一个浮点调度器,新架构拥有两个独立的整数调度器,每个处理器核心一个,可以改进工作弹性和执行效率。
除此之外还有新的电源管理革新技术,但没有披露具体详情。
推土机架构处理器将于2011年在服务器和桌面相继面世,均采用32nm HKMG(高K金属栅极)技术,其中服务器处理器就是上边说过的巴伦西亚、英特拉格斯,桌面的另述。
最后再说一下生产工艺问题。根据由AMD分离出来的GlobalFoundries确定的路线图,32nm工艺将于2010年第三季度开始试产,并在2011年为AMD提供产能,高性能版本的28nm工艺于2010年第四季度上马,超低功耗版28nm工艺则安排在2011年第一季度。它们都会使用HKMG技术。