【Tegra 4i:A9 r4p1架构最新版】
除了不同架构之间的进化,ARM每一个架构也都有不同的版本,比如说同样是A9,Tegra 2使用的是r1p1,Tegra 3里边是r2p9,Tegra 4i又换成了最新的r4p1。
A9 r4p1架构的GHB、二级缓存TLB、BTAC都增大了三倍,赶上了A15的水平,分别有16K、512、4096,这可以改进分支预测精确度,进一步提升IPC。
数据预取引擎也增强了,包括一个小的一级缓存预取器、单独的缓存预载指令硬件。
NVIDIA宣称,A9 r4p1相比于r2p9可以在SPECint_base测试中获得15%的成绩提升,仅仅是架构微调就获得如此好的整数性能改进着实惊人,当然真实情况如何还不太好说。不管怎样,配合2.3GHz的最高频率,Tegra 4i CPU性能会比Tegra 3好不少。
根据数据,Tegra 5里每个CPU核心的面积为2.7平方毫米,稍大于高通Krait 800,Tegra 4i则仅为1.15平方毫米。单论最大性能,Tegra 4在三者之中最为突出(高通肯定不服),而在性能频率比、性能面积比上,Tegra 4、Tegra 4i分别是最好的。
【坚守四核心】
Tegra 3是四核心(也可以说4+1),Tegra 4并未继续扩充,NVIDIA移动事业部高级副总裁Phil Carmack也在去年初就坦率地告诉媒体,四核心将是未来NVIDIA SoC的一个标准。
其实,四核心对于处理器来说是个不错的选择:核心和线程数量够多,足以应付多线程负载;每个核心可以单独开关,或者部分休息部分加速,也能很好地执行单线程负载;应用方面已经绰绰有余,核心再多纯属浪费;用户和宣传方面也足够好看了,再多可能就让人反感和质疑了。28nm新工艺和A15新架构加持之下,NVIDIA停留在四核心上是非常明智的。
Tegra 3的核心面积大约80平方毫米,Tegra 4塞入了晶体管,但感谢新工艺,面积稍大了一些但仍在80平方毫米这个档次上。
不过在台积电生产线上,28nm HPL工艺晶圆的成本显然要大大高于40nm LPG,更何况还有良品率问题,所以Tegra 4的成本必然高出不少,后果就是设备价格不会多低。
说实话,Tegra 4并不完全是那种震惊业界、引领时尚的芯片(除了首款四核心A15的名号),但综合来说却是NVIDIA的最佳选择,无论技术上还是商业上。