细数Tegra 4的几大失望之处:GPU架构还是NV4x
  • 上方文Q
  • 2013年01月14日 15:16
  • 0

两年前NVIDIA的Tegra 3是世界首款四核Cortex-A9处理器,今年的CES前夕NVIDIA又顺利地抢先发布了世界第一款四核Cortex-A15处理器,而且借着Tegra 4的强大性能,NVIDIA还推出了代号Project Shield的游戏机,左手持Tegra 4利刃,右手握游戏机盾牌,杀向了今年的移动处理器市场。

细数Tegra 4的几大失望之处:GPU架构还是NV4x

发布几天来,我们也陆续了解了一下Tgera 4处理器的一些规格以及跑分性能,不过它背后还有很多不为人知的秘密。超能网综合了多方来源对Tegra 4处理器的介绍与分析,还有各种吐槽,大家也可以从多个角度来了解一下NVIDIA 2013年的第一款明星产品。

文中提到的内容及数据主要来源于几家国外权威媒体,包括AnandtechExtremetechHeise以及“毒舌”BSN,下文不再一一提及。

Tegra 4基本情况:四核Cortex-A15架构、频率最高1.9GHz

NVIDIA的Tegra 4是世界首款四核Cortex-A15架构ARM处理器,此前唯一的Cortex-A15处理器是三星的Exynos 5 Dual双核,Nexus 10上使用的正是1.7GHz频率的Exynos 5250,因此在四核架构方面Tegra 4还是比较领先的,不过三星今年将推出big.LITTLE架构的八核处理器,内有4个Coretex-A15和Cortex-A7核心,华为据说也在开发Cortex-A15架构的K3V3处理器,Tegra 4还要加速上市速度才行。

细数Tegra 4的几大失望之处:GPU架构还是NV4x Tegra 4处理器核心架构图

Tegra 4使用的是TSMC的28nm HPL HKMG工艺,相比HPM工艺它主要优化了漏电流和峰值频率,比Tegra 3使用的40nm LPG工艺优秀得多,所以Tgera 4的最高频率达到了1.9GHz,核心面积约为80mm2,低于苹果A6X的124mm2,基本维持在了Tegra 3的80mm2量级,只不过晶体管规模肯定更高,具体数值未知。

此外,Tgera 4依然沿用了Tegra 3的4-Plus-1设计,也就是说实际上有5个核心,另外一个隐藏核心也是Cortex-A15架构的,不过频率、电压以及功耗要低得多,主要用来应付一些不需要高性能的应用,这样可以降低功耗,延长续航时间。

这个隐藏/伴生核心在系统里也是不可见的,而且它也不是三星那样的big.LITTLE架构,工作原理应该跟Tegra 3里的隐藏核心类似。

内存方面,Tegra 4终于一改Tegra 3只支持单通道内存的不足了,开始支持双通道LP-DDR3/DDR3L/LPDDR2,不过内存频率还没有准确数据,三星Exynos 5的DDR3频率达到了800MHz,Tegra 4至少也该有这个水平。

续航与功耗:功耗减少45%,TDP大约8W

新工艺的直接好处就是降低了处理器功耗,Tegra 4的功耗号称比Tegra 3减少了45%,视频播放续航时间为14小时。

芯片的TDP参数未知,不过Heise从Project Shield游戏机中估算了一下,它配备的是38Wh电池,续航时间是5-10小时(在掌机中这个续航算是很低了),因此功耗大约是3.8-7.6W左右,如果算上内存、WiFi之类的消耗,那么实际功耗在5W左右。

这个功耗是什么概念呢?结合之前Anandtech做过的芯片级功耗测试来看,三星的Exynos 5250处理器的典型功耗在4W左右,最大功耗约为8W,因此四核的Tegra 4控制的还算不错,只不过这个“不错”的前提只适用于配备大容量电池的平板上。

我们把Project Shield游戏机看作一个5英寸720P、38Wh电池的手机,其游戏续航时间是5-10个小时,然后以小米2手机为参照对象,其电池容量为2000mAH,电压3.7V,电池容量是7.4Wh,在我们的测试中GLBenchmark放电时间是3小时27分,那么,使用与小米2手机同样容量电池的Tegra 4手机游戏续航时间恐怕只有1-2个小时,只有小米2手机的一半左右,而且这还没考虑手机里各种信号芯片的消耗。

细数Tegra 4的几大失望之处:GPU架构还是NV4x 小米2满载时游戏续航时间大约是3个半小时

当然,这个换算是比较粗放的,手机/平板的真实续航时间还要看屏幕以及厂商的优化,但是从NVIDIA官方给出的数据换算来看Tegra 4用在手机上恐怕需要在续航上作出一些妥协。

GPU:非统一渲染架构,核心源于NV4x架构

Tegra 4的CPU架构部分是基于Cortex-A15指令集的,32位ARM架构上NVIDIA还不会开发自己的指令,Project Denver计划的产品倒是有可能跟高通一样自主开发ARM兼容架构,所以Tegra 4的CPU架构不做介绍了,GPU部分是NVIDIA自己开发的,这个才是重点。

先说Tegra 4问世之前的一个小插曲。NVIDIA今年推出的Kepler架构功效非常高,一改Fermi时代的高发热高功耗旧貌,黄仁勋在公司内部邮件中表示Kepler架构如此高效甚至可以用到移动处理器上,而许多人确实很期待Tegra 3之后的产品会升级到统一渲染架构。

等Tegra 4露面了,统一渲染架构的设想已经被证实不可能了。NVIDIA市场总监Nick Stam证实,Tegra 4的72个GPU核心由48个PS像素顶点单元和24个VS顶点着色单元组成,延续了Tegra 2/3使用的GeForce ULP核心,其中Tegra 3上的PS、VS单元分别是8个、4个。Tegra 4的规模正好是Tgera 3的6倍,当然还有一些渲染管线以及缓存容量的调整,不过纹理单元规模没有提及。

GeForce ULP架构源于GeForce 6/7时代的NV4X架构,是2004年的产品了,PS3中使用的RSX架构其实就是GeForce 7800 GTX的NV47核心的改款。

细数Tegra 4的几大失望之处:GPU架构还是NV4x Tgera 3处理器的跑分,Tegra 4在GLBencmark中的性能是前者的2.5倍左右

在统一渲染架构支持方面走的比较靠前的是PowerVR,SGX 5系列开始就已经支持统一渲染架构了,这都是几年前的事了,新一代SGX 6系列还会继续提升。

不过监Nick Stam认为,苹果的处理器中图形核心占据了太多面积,而实际游戏“并不是那么让人着迷”,而NVIDIA的长处不是堆硬件,而是软件和驱动优化,通过与游戏开发商的合作与优化是可以打败iPad的。

细数Tegra 4的几大失望之处:GPU架构还是NV4x GPU虽然是NVIDIA的强项,但是Tegra 2/3使用的都是很古老的核心,性能参数都低于同时代的移动处理器,Tegra 4没想到也是如此

不管哪种种架构,具体的性能上NVIDIA宣传的都是6倍提升,具体的游戏测试中应该能达到3-4倍性能提升(NVIDIA语)。从日前曝光的性能测试来看,GLBenchmark 2.5中现在的Tegra 4跑分已经达到Tegra 3的2.5倍左右,相当于A6X的62%,优化之后得分应该还会有所提升。

API规范:不支持OpenCL也没有CUDA,甚至不支持OpenGL ES 3.0

GPU架构的硬件设计先不去管它,再来看Tegra 4最为人诟病的地方——那就是作为新一代的移动处理器,它竟然不支持现有的技术规范,GPU计算方面完全不支持OpenCL,NVIDIA自家的CUDA也不支持,图形规范上也不支持OPenGL ES 3.0(NVIDIA的宣传中都没提这一点,Heise上说的是不支持,应该还是停留在Tegra 3的ES 2.0规范上),微软的DX10/DX11.1也不要指望了。

细数Tegra 4的几大失望之处:GPU架构还是NV4x 高通骁龙S4系列的处理器已经通过OpenCL这样的规范实现GPU和GPU同时加速性能提升,NVIDIA在这方面反倒保守了

BSN对这个问题很在意,特地询问了NVIDIA官方,后者在回复中表示:“现在的移动应用中根本无法利用OpenCL、CUDA以及更高级的OpenGL规范的优势,Tegra 4的GPU性能非常强劲,我们的目标是致力于提高终端用户的真实体验。

NVIDIA没说出口的深层原因也许是Tegra 4的GPU架构实在太老了,还是GeForce 6/7时代的,那时候OpenCL以及自家的CUDA恐怕还在酝酿阶段,所以干脆不提这些技术规范了,这一举动也让BSN大加吐槽,这跟NVIDIA在桌面及HPC领域中推崇GPU计算的表现完全不符啊。

BSN还举例称不支持OpenCL这样的规范已经对NVIDIA的Tegra造成了影响,在宝马新一代硬件竞争中NVIDIA就败给了飞思卡尔,后者使用的Vivante图形核心支持最新的OpenGL ES 3.0以及OepnCL规范,而NVIDIA的不行,这就是他们出局的原因。

另外,不支持这些规范对NVIDIA未来的市场竞争也很不利,Futuremark即将推出新一代跨平台测试软件,Rightware的Basemark X也会如此,他们都要求更高的API规范支持。实际上从CES展会上的现场测试来看也是如此,对OpenCL、OpenGL ES 3.0支持较好的高通APQ8064处理器手机以及iPad得分都比较靠前,而Tegra 3处理器就非常靠后。

还有Windows RT设备上的,高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范。据说高通没能入选Surface RT平板处理器是因为当时他们没搞定驱动,所以微软才选了Tegra 3,而且有消息表示下一代Surface RT平板将使用高通、AMD以及Intel的芯片,毕竟这三家的移动GPU核心对DX11规范支持的更好。

结语

在Tegra 4没公开之前,传闻中的各种规格确实让人很兴奋,四核Cortex-A15核心,统一渲染架构,72个图形单元,支持DX11、OpenCL、OpenGL 4.x以及CUDA规范,但是最终有些变成现实了,而有些落空了,特别是API规范方面与大家的预期相比是一落千丈。虽然NVIDIA嘴硬说这些规范没什么意义,他们更关注用户体验,但是作为新一代的移动处理器,Tegra 4至少也要在市场上撑两年,别人已经支持的规范你却不支持,这在宣传上已经吃亏了。

还有就是Tegra 4处理器的功耗和续航,作为一个四核Cortex-A15架构的处理器来说,4-8W的功耗跟现在的三星Exynos 5双核差不多,看起来已经很不错了,不过三星的双核Cortex-A15处理器目前只用在了平板中,依然没能进入手机市场。目前使用Tegra 4处理器的设备也主要是平板,用在智能手机上恐怕还得优化一下功耗管理,该降频就得降频。

最后就是上市时间了,这个问题甚至要比规格性能高低的影响还要大,目前能提供28nm四核处理器的主要是高通一家(其实国内的瑞芯也推出了28nm工艺的四核Cortex-A9处理器了),无论是平板还是手机,现在不用APQ8064都不好意思说自己是旗舰了。

NVIDIA如果能在未来两三个月内将大批Tegra 4设备推向市场,那么跟高通还有的一拼,如果要拖到年中或者下半年了,那么三星的28nm HKMG工艺的四核Cortex-A15处理器、高通的骁龙600/800处理器也要问世了,到时候竞争烈度就会更高,Tegra 4的优势还有多少呢?

 

文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0