Xeon E3-1200,本来是Intel面向单路服务器和工作站市场的产品,但没想到因为各种机缘巧合,竟然在众多玩家群体中流行开来,一代一代被追逐着,甚至出现了所谓的盒装版,这让Intel自己也十分吃惊。
如今,该系列已经发展到第四代Broadwell Xeon E3-1200 v4,但是和整个Broadwell家族一样,它的产品线和定位也与以往截然不同,不再大规模集体出动,而是只有廖廖六款型号,而且主要是面向多媒体转码和VDI(虚拟桌面基础架构)平台的。
1200 v4系列都是四核心八线程、6MB三级缓存,大部分都配备顶级核显GT3e Iris Pro P6300,48个执行单元、128MB eDRAM嵌入式缓存,只有最低端的1258L v4配备的是GT2 HD P5700,24个单元且无缓存。
1258L v4、1278L v4还都采用了BGA整合封装,其他的则是LGA1150标准接口。
最有趣的一对是1285 v4、1285L v4,基准频率只差100MHz,热设计功耗却分别是95W、65W,而后者还便宜了几乎100美元,大约五分之一。
你或许发现了,三级缓存这里少了2MB,但是有不少专家认为,128MB eDRAM缓存完全可以担当四级缓存,而且有着500GB/s的高带宽足以弥补三级缓存的缺失。
128+6MB的末级缓存组合相比于8MB,容量增大了接近16倍,因此理论上缓存命中失败会降低到原来的1/4,再加上它的延迟要比主内存低得多,无疑能大大提升性能。
另外,eDRAM还大大降低了成本,最终定价也比Haswell时代低了不少。
eDRAM还有一个好处,那就是支持了图形虚拟化技术(GVT),可以通过GPU加速来提升每一个虚拟机的性能。
今年第四季度,Intel还会推出一个扩展卡“Valley Vista”,单块电路板上整合三颗Broadwell-H Xeon E3处理器,都有Iris Pro,非常适合AVC转码等特定的高密度负载。
1200 v4搭配的芯片组是C226,基本上就是专业版的Z97,提供六条PCI-E 3.0、DMI 2.0 x4、六个USB 3.0、六个SATA 6Gbps。
【平台配置、功耗测试】
本次参与测试的1200 v4家族成员有三个,分别是最高端的1285L v4 95W、中端的1285L v4 65W、最低端的1265L v4 35W,正好反应不同层次的差异,而对比的重点自然是不带eDRAM缓存的上一代Haswell v3。
测试平台也不是专业的服务器,而是很普通的消费级配件,相信更适合大家的口味。
先来看看功耗,确切地说是满载功耗减去待机功耗,也就是实际工作消耗的能量。
35W的果然牛逼,还不到60W。95W、65W的倒其实差不多,都在85W左右。当然再次指出,热设计功耗是散热指标,和实际功耗没有直接对应关系。
【专业应用测试:Windows】
2D-3D图像转换:eDRAM缓存让1200 v4快了几乎两分钟。
CineBench R15渲染测试:Broadwell架构不但提升了IPC,多线程管理能力也优于Haswell,因此单线程性能基本相当,多线程1200 v4就领先了。
x264 MP4视频转码:第一个低质量转码只需要更快的CPU就行了,1276 v3、1285L v4这里差不多就很正常了,后者也得到了eDRAM的帮助。第二个高质量转码更依赖内存访问,1200 v4完胜。
x265视频转码:1200 v3这里表现更棒一些。
【专业应用测试:GTX 980】
应邀加入SPECviewperf 12,一个基于行业标准的性能考察工具。这里用了一块GTX 980,模仿标准的工作站环境。
多数项目里似乎都遇到了显卡的瓶颈,但也有几个能看出更快CPU的好处,只不过幅度不大,最多也就5%而已。当然,对比更老的优势就比较明显了。
【办公与网络性能测试】
Dolphin是单线程的,只看架构和频率,因此频率更高的1200 v3明显占优。
WinRAR能充分利用eDRAM缓存,而且多线程优化到位,1200 v4自然大获全胜,不过注意95W型号并不是最好的。
3D粒子模拟:和CineBench比较类似。
图像编辑:1200 v3的高频率依然取得了胜利。
Web性能上,Kraken、Octane 1200 v4都有明显提升,Skylake的肯定会更好。
【游戏测试:核显、低端独显R7 240】
Broadwell GT3e果然是最强集显,无论桌面上的Iris Pro 6200,还是服务器里的Iris Pro P6300,都已经完爆最好的AMD APU,但是P6300相比于i7 6200还是略差一些,毕竟后者对游戏优化得更多。
【游戏测试:中端独显R9 285/GTX 770】
1200 v4表现还是不错的,不过不同项目里起伏较大,而且总的来说,大部分时候不同处理器的差别并不是很大。
【游戏测试:高端独显R9 290X/GTX 980】
到了这个档次的显卡上,不同主流处理器基本就没什么关系了,想要突破瓶颈非得Haswell-E之类的发烧平台。
【结语:65W的反而亮了】
1285 v4 95W、1276 v3 84W本来应该是本次对比的重点,上演王者之争。二者功耗差不多,前者有eDRAM,而后者频率更高达3.6-4GHz。
但是,1285L v4 65W却抢走了太多镜头。它被老大哥只低了100MHz的基础频率,其他几乎完全相同,但是热设计功耗却低了30W,显然不单是频率之差,后者有着更好的电压/频率配置。
1285 v4只在极少数项目中取胜,1285L v4则赢了几乎全部测试,最关键的就是在全部的测试时间中,都维持了较高的加速频率,自然轻松胜出。
更关键的是,它还要便宜111美元!
那么,1285L v4、1276 v3谁更优秀呢?这个要分情况了。WinRAR等严重依赖内存的测试中,因为需要大量缓存,eDRAM就发挥了很明显的作用。显卡相关中,无论核显还是独显Broadwell v4都明显更胜一筹。
至于其他项目,有些两极分化,1276 v3凭借高频率赢了计算相关项目,1285L v4则胜在了数据相关的。
虽然从表面规格上看,1200 v4系列更加退化,似乎神话不再,但是经过测试可以发现,它还是可圈可点的:工艺更先进,架构更优秀,优化更到位,核显更强大,eDRAM缓存也更是成了奇兵。