Tegra 4深度解析：它为什么这么猛？-快科技-科技改变生活

Tegra 4处理器的性能是有目共睹的，作为全球首款四核心Cortex-A15架构处理器的它确实展现出了非凡的潜力，至少从目前的情况来看，除了骁龙800以及Exynos 5420等寥寥几款处理器之外是罕逢敌手的。

那么为什么Tegra 4能够展现出如此非凡的潜力呢？来看看我们的深度解析吧。

首先是Tegra 4的架构：

Tegra 4是全球首款四核心Cortex-A15架构处理器，而且实际上Tegra 4内部是有5颗核心的，除了4颗高性能Cortex-A15核心之外还有一颗主打低功耗的Cortex-A15协核心，主要用来处理一些要求相对较低的任务以增强续航时间。频率方面，Tegra 4四个主力核心最高都可达1.9GHz，而如果使用少量核心，可以加速到更高速度。

Tegra 4深度解析：它为什么这么猛？

GPU方面，Tegra 4 GPU各方面都比上一代扩充了不少，总计拥有72个核心，包括48个像素核心、24个顶点核心。最高频率提升到了672MHz，上代为520MHz，但不支持OpenGL ES 3.0。

Tegra 4深度解析：它为什么这么猛？

上述的只是大提上的规格，而在实际使用过程中NVIDIA会将Tegra 4分为几个不同的版本，目前已知的手机版Tegra 4型号为AP40，这个版本在多个方面做了精简，例如T40有很多的I/O口，AP40只保留了必要的，温控的策略也会有不同。诸如小米手机3等产品以及部分平板搭载的都是这一处理器。

而SHIELD 采用的Tegra 4具体型号是T40，是Tegra 4的顶级性能版本，最高频率设定为1.9GHz，性能方面相对前者来说自然也要更强一些，毕竟无论是散热条件还是电池容量，Shield都要比手机高出不少。

从一些厂商提供的消息，经过这些精简后，AP40的TDP（热设计功率，代表能让设备低于结温所需的散热能力）从T40的8-10瓦降低到了3瓦级别，这相当降低到了1/3不到，变化非常大。

Cortex-A15让Tegra 4强大

Cortex-A15是ARM Cortex-A家族中目前最强劲的CPU内核架构，发布时间为2010年，德州仪器是最早（2011年）投产基于该架构处理器（型号为OMAP 5）的授权厂商。

和ARM的Cortex-A7、Cortex-A9等微架构相比，Cortex-A15有很大的不同。

A15和A9同样具备乱序执行，但是Cortex-A15具备（两倍）的指令发射端口和执行资源，指令解码能力也要高出50%，动态分支预测能力更强（采用了多层级分支表缓存），指令拾取带宽更强（128 bit vs 64 bit），这些都能让A15的流水线执行具备更高的效率。除此以外，A15采用了VFPv4浮点单元设计，能执行FMA指令以及硬件除法指令，相较而言A9的峰值向量浮点性能基本上只有A15的一半。

NVIDIA其实是ARM指令集架构的授权拥有者，但这一次，Tegra 4使用的还是处理器授权，而不是NVIDIA自己设计的定制核心(就像高通Krait、苹果Swift那样的)，那要到“丹佛工程”上才能实现。

A15的架构要比A9宽得多、深得多，整数流水线也从9级增加到了15级，但是分支预测同样改进显著，但愿能比弥补长流水线的缺憾。

A15的前端宽了50％，指令拾取带宽翻番，有利于提升指令级并行(ILP)，而为了充分利用三宽度发射，ARM大大增加了重排序缓冲(ROB)和所有相关数据结构的尺寸。A9可以在重排序缓冲内保留大约32-40个已解码指令，A15则能保留128个，仅此一点就足以反映两种架构的巨大差异：A9是基于A8的自然演化，A15则是一次全新的飞跃式革命。

执行核心方面，A15的规模仍然更大，执行端口、执行单元都要比A9的多，均有助于提升ILP、单线程性能，还采用了多重、独立的发射队列的方式，以保持高频率。每一个发射队列都可以接受最多三条指令，所有的发射队列都可以并行分发。

A15也可以执行乱序指令，但能力更强了。A9上所有的浮点/NEON指令都必须顺序执行，但在A15上可以乱序，但是它依然不能重排序所有内存操作：独立载入可以乱序执行，但是存储不能在载入之前完成。

Tegra 4深度解析：它为什么这么猛？

A15还改用了集成式二级缓存结构，而不是A9上的独立IP块。A15的一级、二级缓存延迟基本没变，不过在一些情况下应该会比A9多上1-2个时钟周期。二级缓存TLB和其它数据结构明显增大，以满足整个架构的需要。

缓存容量上，一级还是32KB指令、32KB数据，但是二级增至2MB，并为所有核心共享(Tegra 4的第五个节能核心还有自己的512KB二级缓存)，任何核心只要允许都可以单独占用全部2MB二级缓存。

A15是目前唯一可以在性能上超越当今流行A9核心的ARM架构，不过性能也不菲。根据三星最新公布的数据，A15可以提供最多3倍于A9的性能，但核心面积要达到4倍，当然功耗则要付出6倍。

目前Tegra 4采用的正是标准的Cortex-A15架构设计，岂有不强之理呢？

Tegra 4跑分实测

尽管对于智能手机来说跑分是次要的，做好用户体验才是最主要的，但我们不能否认的是跑分确实能够给我们提供一个比较直观的参考，那么下面我们就来看看两款Tegra 4设备的得分情况吧。

搭载Tegra 4（AP40）处理器耳朵小米手机3则能够跑出36661分的成绩，安兔兔给出的是A+的评定，这证明小米手机3搭载的Tegra 4处理器虽然频率稍低一些，但性能并不落后于原版的Tegra 4太多。

这也难怪小米公司创始人兼首席执行官雷军会表示：“搭载Tegra 4的Mi3一定会让消费者爱上它所带来的精彩体验。我们之所以与NVIDIA合作，就是想要让这款手机无比出色。Tegra 4可提供智能手机史上前所未有的性能与特性。”

从性能来看，Tegra 4毫无疑问是目前手机处理器中的霸主，无论是CPU还是GPU方面的表现都非常惊艳，完全能够保证用户在运行大型3D游戏或者程序时候能够流畅稳定，彰显NVIDIA的大厂风范。

相关报道

最热文章排行查看排行详情

邮件订阅

分享到