Tegra 4深度解析:它为什么这么猛?
  • 远轩
  • 2013年10月12日 11:47
  • 0

Tegra 4处理器的性能是有目共睹的,作为全球首款四核心Cortex-A15架构处理器的它确实展现出了非凡的潜力,至少从目前的情况来看,除了骁龙800以及Exynos 5420等寥寥几款处理器之外是罕逢敌手的。

那么为什么Tegra 4能够展现出如此非凡的潜力呢?来看看我们的深度解析吧。

首先是Tegra 4的架构:

Tegra 4深度解析:它为什么这么猛?

Tegra 4是全球首款四核心Cortex-A15架构处理器,而且实际上Tegra 4内部是有5颗核心的,除了4颗高性能Cortex-A15核心之外还有一颗主打低功耗的Cortex-A15协核心,主要用来处理一些要求相对较低的任务以增强续航时间。频率方面,Tegra 4四个主力核心最高都可达1.9GHz,而如果使用少量核心,可以加速到更高速度。

Tegra 4深度解析:它为什么这么猛?

GPU方面,Tegra 4 GPU各方面都比上一代扩充了不少,总计拥有72个核心,包括48个像素核心、24个顶点核心。最高频率提升到了672MHz,上代为520MHz,但不支持OpenGL ES 3.0。

Tegra 4深度解析:它为什么这么猛?

上述的只是大提上的规格,而在实际使用过程中NVIDIA会将Tegra 4分为几个不同的版本,目前已知的手机版Tegra 4型号为AP40,这个版本在多个方面做了精简,例如T40有很多的I/O口,AP40只保留了必要的,温控的策略也会有不同。诸如小米手机3等产品以及部分平板搭载的都是这一处理器。

而SHIELD 采用的Tegra 4具体型号是T40,是Tegra 4的顶级性能版本,最高频率设定为1.9GHz,性能方面相对前者来说自然也要更强一些,毕竟无论是散热条件还是电池容量,Shield都要比手机高出不少。

从一些厂商提供的消息,经过这些精简后,AP40的TDP(热设计功率,代表能让设备低于结温所需的散热能力)从T40的8-10瓦降低到了3瓦级别,这相当降低到了1/3不到,变化非常大。

Cortex-A15让Tegra 4强大

Cortex-A15是ARM Cortex-A家族中目前最强劲的CPU内核架构,发布时间为2010年,德州仪器是最早(2011年)投产基于该架构处理器(型号为OMAP 5)的授权厂商。

和ARM的Cortex-A7、Cortex-A9等微架构相比,Cortex-A15有很大的不同。

Tegra 4深度解析:它为什么这么猛?

A15和A9同样具备乱序执行,但是Cortex-A15具备(两倍)的指令发射端口和执行资源,指令解码能力也要高出50%,动态分支预测能力更强(采用了多层级分支表缓存),指令拾取带宽更强(128 bit vs 64 bit),这些都能让A15的流水线执行具备更高的效率。除此以外,A15采用了VFPv4浮点单元设计,能执行FMA指令以及硬件除法指令,相较而言A9的峰值向量浮点性能基本上只有A15的一半。

NVIDIA其实是ARM指令集架构的授权拥有者,但这一次,Tegra 4使用的还是处理器授权,而不是NVIDIA自己设计的定制核心(就像高通Krait、苹果Swift那样的),那要到“丹佛工程”上才能实现。

A15的架构要比A9宽得多、深得多,整数流水线也从9级增加到了15级,但是分支预测同样改进显著,但愿能比弥补长流水线的缺憾。

A15的前端宽了50%,指令拾取带宽翻番,有利于提升指令级并行(ILP),而为了充分利用三宽度发射,ARM大大增加了重排序缓冲(ROB)和所有相关数据结构的尺寸。A9可以在重排序缓冲内保留大约32-40个已解码指令,A15则能保留128个,仅此一点就足以反映两种架构的巨大差异:A9是基于A8的自然演化,A15则是一次全新的飞跃式革命。

执行核心方面,A15的规模仍然更大,执行端口、执行单元都要比A9的多,均有助于提升ILP、单线程性能,还采用了多重、独立的发射队列的方式,以保持高频率。每一个发射队列都可以接受最多三条指令,所有的发射队列都可以并行分发。

A15也可以执行乱序指令,但能力更强了。A9上所有的浮点/NEON指令都必须顺序执行,但在A15上可以乱序,但是它依然不能重排序所有内存操作:独立载入可以乱序执行,但是存储不能在载入之前完成。

Tegra 4深度解析:它为什么这么猛?

A15还改用了集成式二级缓存结构,而不是A9上的独立IP块。A15的一级、二级缓存延迟基本没变,不过在一些情况下应该会比A9多上1-2个时钟周期。二级缓存TLB和其它数据结构明显增大,以满足整个架构的需要。

缓存容量上,一级还是32KB指令、32KB数据,但是二级增至2MB,并为所有核心共享(Tegra 4的第五个节能核心还有自己的512KB二级缓存),任何核心只要允许都可以单独占用全部2MB二级缓存。

A15是目前唯一可以在性能上超越当今流行A9核心的ARM架构,不过性能也不菲。根据三星最新公布的数据,A15可以提供最多3倍于A9的性能,但核心面积要达到4倍,当然功耗则要付出6倍。

目前Tegra 4采用的正是标准的Cortex-A15架构设计,岂有不强之理呢?

Tegra 4跑分实测

尽管对于智能手机来说跑分是次要的,做好用户体验才是最主要的,但我们不能否认的是跑分确实能够给我们提供一个比较直观的参考,那么下面我们就来看看两款Tegra 4设备的得分情况吧。

搭载Tegra 4(AP40)处理器耳朵小米手机3则能够跑出36661分的成绩,安兔兔给出的是A+的评定,这证明小米手机3搭载的Tegra 4处理器虽然频率稍低一些,但性能并不落后于原版的Tegra 4太多。

Tegra 4深度解析:它为什么这么猛?

这也难怪小米公司创始人兼首席执行官雷军会表示:“搭载Tegra 4的Mi3一定会让消费者爱上它所带来的精彩体验。我们之所以与NVIDIA合作,就是想要让这款手机无比出色。Tegra 4可提供智能手机史上前所未有的性能与特性。”

从性能来看,Tegra 4毫无疑问是目前手机处理器中的霸主,无论是CPU还是GPU方面的表现都非常惊艳,完全能够保证用户在运行大型3D游戏或者程序时候能够流畅稳定,彰显NVIDIA的大厂风范。

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0