二、推土机服务器处理器前瞻
AMD透露,推土机架构的皓龙Opteron处理器在2010年第二季度完成流片,第四季度向合作伙伴提供了测试样品,预计今年第二季度投入量产,第三季度全面出货并发布。消费级的桌面版则要早一些,第二季度末就会登场。
推土机服务器处理器有最多16核心的Interlagos、最多8核心的Valencia两个版本,分别兼容现有的Socket G34、Socket C32接口平台。它们都有支持256位浮点计算的弹性浮点单元(Flex FP)、所有核心都可加速500MHz的Turbo Core技术、计算能力提升最多50%、内存带宽提升最多50%。这四个方面我们会在后边一一详细解释。
这是推土机的模块化架构图,已经见识过很多次了。
这部分非常有趣,比较详细地披露了推土机皓龙Opteron处理器的规格参数:
核心数量方面,Opteron 4200系列6/8个,Opteron 6200系列8/12/16个,都比现在多三分之一;
缓存方面,每两个核心(也就是每个模块)共享2MB二级缓存,然后所有模块与核心共享8MB三级缓存,现在是每核心512KB二级缓存、共享6MB三级缓存;
内存方面,Opteron 4200系列双通道,Opteron 6200系列四通道,频率最高1600MHz,现在只有1333MHz;
浮点能力方面,每个核心可单独执行128位FMAC运算,每个模块可执行256位AVX指令,现在每个核心只能执行128位FADD、FMUL;
整数能力方面,每个时钟周期可执行四个整数发射,现在只有三个;
Turbo Core技术方面,可以所有核心同时提速最多500MHz,现在没有此技术;
功耗方面,仍然计划有65W、80W、105W三种;
指令集方面,新增的非常多,包括SSSE3、SSE4.1/4.2、AVX、AES、FMA4、XOP、PCLMULQDQ等等;
节能技术方面,除了已有的CoolCore、C1E又增加了关闭更多模块和晶体管、更加深入节能的C6电源状态;
制造工艺方面,从45nm SOI升级为32nm SOI,每个内核尺寸更小。
性能和功耗只有大概的估计,其中性能方面16核心可比现有12核心提升50%,也就是核心增多33%情况下,速度快了一半,这其实是很不容易的。功耗方面仍然分为高性能版、标准版、低功耗版三种,和现在保持一致。
Turbo Core,这个得多说两句。现在桌面上的Phenom II X6系列六核心处理器已经支持Turbo Core技术,但只能算是1.0版本,不是很灵活,加速幅度也有限。推土机的称得上Turbo Core 2.0,即使是16个核心全部开启,也能全都加速最多500MHz,而不再需要关闭部分核心。这是因为推土机处理器的预设频率都只是个基准值,AMD已经为其预留了很大的加速空间,可在确保不超过热设计功耗的情况下短时间加速,满足更高工作负载的需要。