1.崛起的手机处理器
当PC平台的DIY热潮已经呈现衰败之势后,玩家们身上的极客精神是不会消失的,而智能手机产品的兴起,开始承担起玩物的任务。
从2008年到现在,短短的三年多时间中,我们看到了iPhone和Android的崛起,Windows Phone 7的新生,也有Symbian、webOS的衰落,还有黑莓的日薄西山 ,智能手机系统正在进行更新换代。
而移动网络也从2G时代快速发展,逐步进入3G和4G,国内用户已经亲身体验到了3G网络带来的高速率体验。
在移动终端软件系统和移动网络速度不断发展的背后,不能忽视的还有移动终端设备的硬件发展。软件、硬件、网络这三个不可分离的条件正在加速移动互联网时代的来临。
我们今天要看的是移动终端设备中硬件中最关键的因素:移动处理器。
在智能机之前的功能机上,处理器仅仅是一个计算核心,没有太多可以关注的亮点,而随着移动操作系统的发展,各种应用环境对处理能力、图形能力的要求越来越高,想更好的使用手机,处理器的性能越来越显的重要,于是类似PC时代DIY的乐趣开始转移到移动平台。
虽然手机不能像PC那样进行模块化组装,但是对硬件知识的了解和需求已经开始成为玩家们的必备。今天我们就带大家一起来看一下智能手机处理器产品的发展历程,以及未来的发展方向。
2.ARM简介
在说处理器之前,我们有必要再提一下ARM架构,这是目前几大移动处理器的核心。
ARM是Acorn电脑公司(Acorn Computers Ltd)于1983年开始的开发计划。ARM架构,过去叫做进阶精简指令集机器(Advanced RISC Machine,更早称作:Acorn RISC Machine),是一个32位精简指令集(RISC)处理器架构,被广泛地应用于嵌入式系统设计。由于低成本、高效能、低耗电的的特点,ARM处理器普遍用于移动通讯领域。
Acorn团队在1985年时开发出ARM1 Sample版,而真正的产能型ARM2于次年量产。ARM2具有32位的数据总线、26位的寻址空间,并提供64 Mbyte的寻址范围与16个32-bit的缓存器。ARM2可能是全世界最简单实用的32位微处理器,其仅容纳了30000个晶体管,而与当时大多数的CPU相同,它没有包含任何的高速缓存。这个精简的特色使它只需消耗很少的电能就可以发挥更好的效能。后继的处理器ARM3更备有4KB的高速缓存,使它能发挥更佳的效能。在1980年代晚期,苹果开始与Acorn电脑合作开发新版的ARM核心,这个方案后来进入了ARM6,首版在1991年试产,然后苹果使用ARM6架构的ARM 610来当作他们Apple Newton PDA的核心。
经历过这些变革之后,ARM内核部份却基本维持一样的大小。ARM2有30000颗晶体管,ARM6也只增长到35000颗。这样做的主要原因是用ODM的方式使ARM核心能搭配一些选配的零件而制成一颗完整的CPU,而且可在现有的晶圆厂里制作并以低成本的方式达到很大的效能。
ARM的经营模式在于出售其半导体知识产权核心(IP core),授权厂家依照设计制作微控制器和中央处理器。包括Atmel、Broadcom、Cirrus Logic、Freescale、富士通、英特尔、IBM、NVIDIA、英飞凌、任天堂、恩智浦半导体、OKI电气工业、三星电子、夏普、STMicroelectronics、德州仪器、高通等多家公司均持有不同形式的ARM授权。
我们要看的是ARM11和Cortex两个家族,这在出场的处理器中会有所涉及。
家族 |
架构 |
内核 |
特色 |
高速缓存 (I/D)/MMU |
常规 MIPS 于 MHz |
ARM11 |
ARMv6 |
ARM1136J(F)-S |
SIMD, Jazelle DBX, (VFP),八级流水线 |
可变动,MMU |
@ 532-665MHz (i.MX31 SoC) |
ARMv6T2 |
ARM1156T2(F)-S |
SIMD, Thumb-2, (VFP),九级流水线 |
可变动,MPU |
|
|
ARMv6KZ |
ARM1176JZ(F)-S |
SIMD, Jazelle DBX, (VFP) |
可变动,MMU+TrustZone |
|
|
ARMv6K |
ARM11 MPCore |
1-4核对称多处理器,SIMD, Jazelle DBX, (VFP) |
可变动,MMU |
|
|
Cortex |
ARMv7-A |
Cortex-A8 |
Application profile, VFP, NEON, Jazelle RCT, Thumb-2, 13-stage pipeline |
可变动 (L1+L2), MMU+TrustZone |
up to 2000(2.0 DMIPS/MHz 从600 MHz到超过1 GHz的速度) |
Cortex-A9 |
|
|
|
||
Cortex-A9 MPCore |
|
|
|
||
ARMv7-R |
Cortex-R4(F) |
Embedded profile, (FPU) |
可变动高速缓存,MMU可选配 |
600 DMIPS |
|
ARMv7-M |
Cortex-M3 |
Microcontroller profile |
无高速缓存,(MPU) |
120 DMIPS @ 100MHz |
|
ARMv6-M |
Cortex-M0 |
|
|
|
|
Cortex-M1 |
|
|
|
||
ARMv7-ME |
Cortex-M4 |
|
Optional 8 region MPU with sub regions and background region |
1.25 DMIPS/MHz |
其中ARM11包含有ARMv6、ARMv6T2、ARMv6KZ、ARMv6K四种架构,依次分别使用的是ARM1136J(F)-S、ARM1156T2(F)-S、ARM1176JZ(F)-S、ARM11 MPCore内核。
Cortex家族包含有五个架构,其中ARMv7-A架构采用了Cortex-A8、Cortex-A9、Cortex-A9 MPCore三种内核,前两种内核分别在苹果A4和A5处理器中得到应用。ARMv7-R架构采用的是Cortex-R4(F)内核,ARMv7-M用了Cortex-M3,ARMv6-M价格则用了Cortex-M0、Cortex-M1两种,ARMv7-ME架构则使用了Cortex-M4内核。另外还有最新推出的Cortex-A15 MPCore内核,被认为是下一代移动处理器的标志。
另外我们再放上一个智能手机GPU的性能速查表。
品牌 |
产品型号 |
标准支持 |
三角形输出 |
像素填充 |
高通(Qualcomm) |
Adreno 130 |
OpenGL ES1.1 |
4M/S |
133M/S |
|
Adreno 200 |
OpenGL ES1.1/ 2.0 |
22M/S |
133M/S |
|
Adreno 205 |
OpenGL ES1.1/ 2.0 |
41M/S |
245M/S |
|
Adreno 220 |
OpenGL ES1.1/ 2.0 |
88M/S |
532M |
Imagination |
PowerVR SGX520 |
不详 |
7M/S |
250M/S |
|
PowerVR SGX530 |
OpenGL ES1.1/ 2.0 |
14M/S |
125M/S |
|
PowerVR SGX535 |
OpenGL ES1.1/ 2.0 |
25M/S |
500M/S |
|
PowerVR SGX540 |
OpenGL ES1.1/ 2.0 |
35M/S |
500M/S |
|
PowerVR SGX543 MP2 |
OpenGL ES1.1/ 2.0 |
35M/S X2 |
1000M/S X2 |
|
PowerVR SGX544 |
OpenGL ES1.1/ 2.0 |
63M/S |
1250M/S |
|
PowerVR SGX545 |
OpenGL ES1.1/ 2.0 |
80M/S |
1500M/S |
博通(Broadcom) |
BCM2727 |
OpenGL ES1.1/ 2.0 |
32M/S |
1440M/S |
|
BCM2763 |
OpenGL ES1.1/ 2.0 |
不详 |
不详 |
英伟达(NVIDIA) |
GeForce ULV |
OpenGL ES1.1/ 2.0 |
90M/S |
1200M/S |
ARM |
Mali-300 |
OpenGL ES1.1/ 2.0 |
30M/S |
275M/S |
|
Mali-400 MP4 |
OpenGL ES1.1/ 2.0 |
30M/S X4 |
275M/S X4 |
3.GHz史前时代
在开始回顾1GHz移动处理器之前,还是要先看几个没有迈入这个门槛的产品,因为他们太难以被人忘却了。
在2009年下半年那段时间,Android平台已经被HTC和摩托罗拉两家厂商带出来很强的增势,包括大家熟悉的G1 Dream、Magic、Hero以及Droid、里程碑等机型,开始成为玩家们换机不得不考虑的对象。
从这个时候开始,手机的处理器、RAM内存等硬件标准开始像以前电脑DIY那样受到玩家们的关注,超频、刷机等DIY的乐趣被延续下来,给大家带来自己动手的无限乐趣。
现在来看看1GHz之前有哪几个值得记住的处理器吧。
3.1 高通代表
说起08年、09年,很多经典机型可以放入Android的历史博物馆,而这些机型中有很大一部分采用了高通的处理器,而这些处理器正是高通MSM7000系列。
MSM7000是由高通公司推出的一套芯片组产品,属于Snapdragon芯片组系列。这些芯片组(SOCs)可以拥有多个处理器核心负责不同的任务,基于该芯片组的设备在操作系统运行应用程序是不具备对称多处理机制能力的,它们只能使用其中一个负责应用程序的核心来运行操作系统和应用程序。
一般情况下,MSM7000系列芯片组拥有以下核心,负责处理不同的任务:
应用程序核心:架构ARM1136EJ-S,负责运行操作系统和应用程序,比如运行Android操作系统。
应用程序数字信号处理器(Applications DSP):QDSP5000,可以解码、反解码数字影片等。
基带核心(Baseband processor):指令集ARM9,负责系统底层和GSM网络等。
基带数字信号处理器(Baseband DSP):QDSP4000,负责设备的通话信号等。
在MSM7000系列的芯片组中都带有一些其他的硬件和驱动,硬件方面有2DGPU、3D(OpenGL ES 1.1)GPU或者媒体解码芯片(视频解码),驱动包含键盘、显示屏、触摸屏驱动、USB、相机、电视等等,还包含一些其他的控制器,比如AXI controller和一些内存控制器单元。
MSM7000系列芯片组被应用在许多智能手机产品中,比如HTC、索尼爱立信、LG、三星电子等,造就了一批明星产品。
首先是MSM7200、MSM7201、MSM7200A、MSM7201A四款产品,带A的为增强型,7201系列又比7200多了一个FM收音机芯片,用的较多的是528MHz、90nm的MSM7200A和528MHz、65nm的MSM7201A,使用MSM7200A的有HTC Magic、HTC Hero GSM、摩托罗拉CLIQ、摩托罗拉CLIQ XT、摩托罗拉Backflip、三星i7500 Galaxy等。
另外还有一个MSM7525芯片组,同样为528MHz、65nm,只是换成了CDMA网络,在HTC Hero CDMA中得到应用。
还有一款明星级产品是高通MSM7227,这款芯片组的CPU采用ARMv6指令集,核心架构为ARM11 36EJ-S,最大主频600MHz,采用65nm工艺制造,并加入了Adreno 200 GPU,支持OpenGL ES 2.0、OpenGL ES 1.1、Direct3D加速等技术。使用这款处理器的产品包括三星Galaxy Mini、中兴Blade、HTC Legend、LG Optimus One P500 GSM、索爱Xperia X8、HTC Wildfire S等。
MSM7227的CDMA版本为MSM7627,它们支持CDMA2000网络,性能配置相同,被用于LG Optimus V CDMA、LG Cosmos Touch、摩托罗拉ES400、三星Galaxy Prevail等机型。
3.2德州仪器代表
如果说高通的处理器产品在Android初期发挥了强大的作用的话,其实德州仪器也是少不了了。大家都知道,Android初期的那一批明星设备里面,除了HTC的之外,摩托罗拉也有很多,特别是Droid和里程碑这两款机型,让摩托罗拉智能手机业务起死回生,也是后来摩托罗拉分拆并被Google收购手机事业部的一个重要因素。
德州仪器的OMAP系列产品也是微处理器行业中一个常青树,在Android智能手机大潮的开始阶段,德州仪器曾经推出了以OMAP 3430、OMAP 3610、OMAP 3621为代表的处理器系列产品。
于2008年问世的OMAP3430是第一款采用OMAP 3架构的多媒体应用处理器产品,也是业界第一个采用65nm CMOS工艺设计的应用处理器。这款产品支持ARMv7指令集,使用的是ARM Cortex-A8 CPU内核,主频600MHz,使用430MHz TI TMS320C64x DSP,集成有IT(Imagination Technologies) POWERVR SGX SGX530 GPU内核,支持OpenGL ES 1.1、OpenGL ES 2.0、OpenVG标准。
使用这款处理器的产品也有很多,包括摩托罗拉MT716、明XT806、明MT810、Droid系列、里程碑系列、诺基亚N900等。
OMAP 3610是2009年问世的另外一款德州仪器处理器产品,同样支持ARMv7指令集,使用ARM Cortex-A8 CPU内核,主频升至720 MHz,并率先升级采用45nm CMOS工艺制作,使用430MHz TI TMS320C64x DSP,官方并未给出GPU型号,仅注明使用POWERVR SGX系列图形芯片。
使用这款处理器的最著名的机型就是摩托罗拉的ME525 Defy系列(也有说用的是3630)。
德州仪器在2010年还推出了一款800MHz的OMAP 3621处理器,支持ARMv7指令集,使用ARM Cortex-A8 CPU内核,采用45nm CMOS工艺制作,使用TI TMS320C64x DSP,集成有IT POWERVR SGX SGX530 GPU内核,支持OpenGL ES 1.1、OpenGL ES 2.0、OpenVG标准。这款处理器在三星的GT-P1010 Galaxy Tab 7.0中得到了应用,让三星开启了他们平板设备的征程。
3.3 Tegra
在察觉到移动处理器产品即将崛起的气息之后,NVIDIA也不甘心于只做PC平台,在2008年的MWC移动通信世界大会上发布了首款Tegra处理器,型号为APX 2500,与后来的APX 2600,以及600、650组成了第一代Tegra产品。
一代Tegra均采用ARMv6K架构,使用ARM11 MPCore CPU内核,集成NVIDIA自家基于GeForce 6的GPU内核,加入对CUDA和双精度浮点运算的支持,设计主频从600MHz到750MHz不等,这些产品均为65nm工艺制作。APX 2600相比APX 2500强化了NAND闪存支持,650则是比600提升了主频和视频解码支持,将720P高清解码提升至1080P。
遗憾的是,NVIDIA在合作伙伴上选择了微软,Tegra处理器的应用仅出现在微软Zune HD播放器上,并未进入到智能手机战场的厮杀。不过在2代产品上,NVIDIA的爆发让不少人为之惊叹。
3.4 iPhone 3GS
iPhone 3GS那一代产品还没有像iPhone 4和4S一样在国内被人疯狂追捧,那一代产品的处理器也没有单独的型号名称,不过仍然值得一提。这款手机的处理器采用的是ARM 1176JZ(F)-S CPU内核,设计频率620MHz,内置有103 MHz的PowerVR MBX Lite 3D GPU核心,支持OpenGL ES 1.1/2.0标准。
4.单核1GHz时代
经历过史前时代的玩家们可能已经发现,智能手机对处理器的需求已经不再像功能手机那样不怎么重要,移动设备对硬件的要求已经变得越来越高,而PC DIY的乐趣也已经开始向智能手机开始转移。于是从2009年12月中旬首次曝光Google要出自有品牌手机之后,关于Nexus One的各方传闻就开始牵动全球手机用户的目光。直到1月6日,真正的Google牌手机正式问世,以Android 2.1和1GHz处理器的强大配置让无数Android玩家心神不宁。
说Nexus One是一款具有历史代表意义的手机完全不为过,Google第一款自有品牌手机、第一款搭载Android 2.1版系统的智能机、首款获得Android 2.2/2.3官方更新升级的产品、Android开发团队指定工程机等等光环。最为重要的是,Nexus One树立起了Android手机高端产品的标杆形象,将Android手机全面带入了1GHz处理器时代。
虽然Google在Nexus One身上寄托的希望最终没有实现,但是亲儿子系列已经成为Android生态系统中的重要一环。同时,也拉开了Android智能手机的硬件大战序幕。
4.1 高通代表
高通在1GHz处理器产品上赚的不少,他们的产品线也非常复杂,在1GHz+单核处理器产品上推出了种类繁多的型号,也和多家厂商一起推出了众多的机型。后来高通把自己的产品线统一以骁龙系列命名,分为S1、S2、S3、S4等不同种类,下文也会参照这个分类进行介绍。
实际上,高通的Snapdragon处理器标志着移动处理器1GHz时代的来临。
首先我们要说一下高通Snapdragon处理器的CPU核心:Scorpion天蝎座。Snapdragon处理器的架构与其他厂商的SoC片上系统有所区别,最大亮点在应用处理核心部分,就是Scorpion架构,它是基于ARM的ARMv7指令集重新设计出来的新架构。
Scorpion源于ARM Cortex-A8内核,拥有指标量指令+矢量指令并行处理能力,且支持NEON DSP核心(高通将它命名为“VeNum”),Scorpion与Cortex-A8相比最大的改变就是Scorpion的 “VeNum”处理单元。不同于原版Cortex-A8中的NEON DSP核心,VeNum处理单元可以同时运算128bit数据,是原版的两倍,特别是Scorpion引入更好的节能技术,VeNum可以在不用的时候关掉其中一半,类似于处理器的功率门限技术。
另外,Scorpion的管线阶层也比Cortex-A8稍高,Scorpion具备了13阶load/store管线以及两个整数处理管线,从而可以让Snapdragon轻松达到更高的频率。当时采用TI高端Cortex-A8应用处理器的手机,最高核心频率都只有600MHz左右,而在类似的功耗条件下Snapdragon可以运行在1GHz,这也是高通率先进入1GHz时代的原因。
Snapdragon也整合了高通自家的Adreno图形处理器。在移动GPU领域, ARM的Mali系列、IT的PowerVR SGX和高通的Adreno系列形成了三足鼎立的局面。这也是区分高通Snapdragon处理器属于第几代的标志。2009年初,高通在收购了AMD包括图形芯片技术在内的掌上设备资产的基础上推出了一种全新的GPU品牌体系Adreno。Adreno GPU至今已经发布了包括Adreno 130、Adreno 200、Adreno 205、Adreno 220、Adreno 300等多款产品。
第一代Snapdragon,也就是高通的S1系列,均采用了Adreno 200,它采用统一的IMR渲染架构,三角形生产率为22M/s,像素填充率为133M/s,这样的规格并不是很出色。
其中S1系列的QSD8650和8250设计主频为1GHz,S2的MSM8655、MSM8255、APQ8055设计主频为1-1.4GHz。S1和S2系列中主频低于1GHz的就不再讨论。
QSD8250是高通第一代Snapdragon 1GHz单核处理器,采用ARMv7指令集的Scorpion架构,使用65nm制程,集成Adreno200显示核心,可以硬解720P软解480P视频。QSD8250支持HSPA数据传输,下行速率可达7.2Mbps,上行达5.76Mbps,并提供全向后兼容。性能相同的QSD8650支持HSPA及CDMA2000 1xEV-DO Rev.B,并提供全向后兼容。
这两款产品均使用1GHz的微处理器核心,搭配高通第六代600MHz DSP核心。
使用这两款处理器的产品包括Google Nexus One、HTC Desire、戴尔Mini 5、索爱Xperia X10a等,还有微软Windows Phone 7的十款一代机型。具体可以看这里:http://news.mydrivers.com/1/176/176733.htm
接着要说的是高通的Snapdragon第二代产品中的代表,包括MSM7230、MSM7630、MSM8255、MSM8655、APQ8055五款。
第二代Snapdragon的S2系列仍是采用基于ARMv7架构的Scorpion核心,但是升级了45nm工艺。二代Snapdragon处理核心在1.3GHz下的标称功耗也仅为一代Snapdragon在1GHz下功耗的2/3。第二代Snapdragon还引入了性能更强的Adreno205图形芯片,它的三角形输出率、像素填充率分别达到41M/s、245M/s,性能是Adreno 200的两倍,与SGX540属于同一档次。
MSM7230是高通蛟龙S2系列中较为低端的一款产品,设计主频为800MHz-1GHz,MSM7630是其CDMA版本。使用这两款处理器的主要机型包括华为U8800、HTC Desire Z、HTC EVO Shift 4G等机型。
MSM8x55系列包含MSM8255和MSM8655两款处理器,是S2系列中相对高端的产品,分别支持GSM网络和双模网络。其设计主频最高达到1.4GHz,也是单核处理器中首款达到1.4GHz的产品。APQ8055与这两款处理器相似,仅去掉了Modem部分。
这三款产品推出的时间较晚,所以应用的机型均是2011年以及2012年推出的较新机型。
MSM8255应用的代表机型包括索爱Xperia mini ST15a、Xperia ray ST18/ST18i、Xperia PLAY 4G、Xperia ray ST18a、HTC Radar C110E、华为U8850、中兴V881、联想乐Phone S2、诺基亚Lumia 601、HTC One V等。
MSM8655代表机型包括HTC ThunderBolt 4G、Incredible、Hero S、EVO Design 4G等。
APQ8055的应用机型比较独特,目前公布的仅有诺基亚Lumia900。
4.2 德州仪器代表
德州仪器的产品线相对较为简单,其1GHz单核心处理器的代表为OMAP3630和OMAP3640两款。
OMAP 3630支持ARMv7指令集,使用ARM Cortex-A8 CPU内核,采用45nm制程,设计主频720MHz,应用主频基本都在1GHz。这款方案使用430MHz TI TMS320C64x DSP,集成有IT(Imagination Technologies) POWERVR SGX SGX530 GPU内核,支持OpenGL ES 1.1、OpenGL ES 2.0、OpenVG标准。整体设计相当于OMAP3430的升级版本。
该处理器集成的SGX 530显示核心频率为200MHz,多边形生成率为1400万多边形/秒,像素填充率1.25亿/秒,处于Adreno 200和Adreno 205之间,而OMAP3430集成的SGX 530降频到110M,所以处理能力只有770万多边形/秒,像素填充率6875万/秒。
使用OMAP3630的代表机型包括摩托罗拉Droid X、里程碑2、Droid 2全球版、诺基亚N9等。
作为德州仪器单核处理器OMAP36XX系列的旗舰产品,OMAP3640虽然基本架构与OMAP3630等产品相同,但是其设计主频提升到了1GHz,同时将画面输出能力提升至1280×800像素分辨率,电源管理/音频编解码器也由同系列使用的TWL4030提升至TWL5030。
不过遗憾的是,目前还没有哪款机型明确标注使用的是这款处理器。
4.3 三星代表
三星研发处理器的历史也不短,包括自家设备和其它品牌的设备上都有应用,例如苹果的前三代iPhone。在2011年2月,三星正式将自家处理器品牌命名为Exynos,由两个希腊语单词组合而来:Exypnos和Prasinos,分别代表“智能”与“环保”之意。
由于iPhone系列的成功,由三星制造的处理器也获得了广泛关注。S5L8900处理器首先应用于2007年发表的第一代iPhone上,其后也使用在iPhone 3G上,该处理器主频为412MHz,当时搭配的GPU是PowerVR MBX-Lite。比较有名的则是S5PC100处理器,使用在2009年推出的iPhone 3GS和第三代iPod touch上,采用Cortex-A8架构,主频为667MHz,但是遇到大程序会自动超频至833MHz,这在前面已经提到过。
三星Exynos系列第一款产品是Exynos 3110,其实这款产品诞生在前,之前型号为S5PC110,代号Hummingbird蜂鸟,在Exynos品牌发布之后被追加命名。
该处理器采用优化的Cortex-A8架构,支持ARMv7指令集,包含了32/32KB数据/指令一级缓存,512KB二级缓存,设计主频为800MHz-1.2GHz,内置有200MHz PowerVR SGX 540 GPU核心,采用45nm工艺制程。这也是三星Exynos系列唯一一款单核处理器。
这款处理器被用于三星Galaxy S系列、GT-S8500 Wave、Wave II S8530、Nexus S、魅族 M9、Galaxy Tab等机型。
4.4 苹果A4
在2010年苹果发布iPad和iPhone时,大家发现苹果已经把移动处理器作为一个独立品牌进行命名和研发了,而不是之前那样羞羞答答,因为处理器也已经成为一大卖点。
苹果的首款移动处理器被命名为A4,其基本架构与三星的S5PC110相似,采用单核心设计,基于Cortex-A8架构,支持ARMv7指令集,集成PowerVR SGX 535图形核心。相比S5PC110,A4去除了一些接口部件,并将二级缓存由S5PC110的512KB扩大为640KB,在同等频率下性能会稍强。
基本上可以认为A4就是S5PC110的一个定制版本,已经应用于iPad、iPhone 4和第四代iPod Touch。
5.大战双核时代
在各家厂商还在为单核处理器的频率能有多高而竞争的时候,在2011年初,移动双核时代就已经悄然来临。而这次的先锋,就是直接跳过了单核时代跑步进军双核市场的NVIDIA,他们抢先开启了移动双核处理器时代的来临,并成功抢占了大量市场份额。
5.1 NVIDIA Tegra 2
实际上NVIDIA早在2010年初就发布了业内首款双核移动处理器Tegra 2,基于台积电40nm工艺制造,共包含2.6亿个晶体管,核心尺寸约为49mm2,8.8mm BGA封装,共有8个独立的处理器核心(第一代Tegra为7个)。
首先的两个核心来自于一颗双核ARM Cortex-A9处理器,最高频率1GHz,支持支持ARMv7-A指令集,后期的Tegra 2 3D还将主频升级至1.5GHz。在第一代Tegra中,NVIDIA使用的是单核心的ARM 11架构,而此次则跳过了Cortex-A8这一代,直接升级双核版Cortex-A9架构设计,相比同期其他厂商处理器在性能上很大的提升,同时支持LPDDR2内存,整体功耗仅为500mW左右。
Tegra 2双核处理器的速度可以达到普通单核Cortex A9处理器1.5倍到2.0倍,是Cortex A8单核处理器的1.7倍到2.4倍。同时NVIDIA使用的SMP对称多处理技术可以为两个处理内核分摊同一任务的独立工作量,两个内核不用全负荷工作,两个处理器核心均使用较低的工作频率和电压可以让系统运行在低功耗状态,从而实现显著的节能效果。
余下的六颗核心分别为一个音频解码核心,一个支持1080p H.264硬件加速的视频解码核心,一个高清视频编码核心,一个最高支持1200万像素摄像头的图片/照片处理核心,一个GeForce 2D/3D图形核心以及一个用于芯片内部数据/功耗管理的ARM 7处理器核心。
与三星、德州仪器等厂商使用授权GPU所不同,NVIDIA坚持在自己的平台方案中使用自己的技术和产品。Tegra使用的GeForceGPU包含四个像素着色器内核和四个顶点着色和内核,专用于高速顶点和像素处理。它还实现了一种独一无二的各向异性过滤(AF)算法,该算法优于许多台式机GPU所使用的AF技术。该架构支持各种高级特性,例如高动态范围(HDR)照明、多重渲染目标(MRT) ,并且两种纹理支持均不会带来功耗。
虽然GeForce GPU架构是一种类似于OpenGL ES 2.0标准定义的管线架构,但它还包含一些特殊特性和自定义功能,可显著降低功耗并提供更高的性能和图形质量。Tegra 2移动处理器中实现的一些独特特性包括:
-Early‐Z支持,专用于过滤掉不可见的像素
-集成像素着色器 (Pixel Shader)和混合单元(Blend Unit),可实现编程灵活性和更高的性能
-像素缓存、纹理缓存、顶点和属性缓存,可减少内存操作
-独特的5倍覆盖采样抗锯齿 (CSAA)技术,可在更低的内存带宽下实现更高的图像质量 -高级各向异性过滤(AF),可实现高细节纹理
-内部开发的自定义内存控制器,可提高GPU性能和降低功耗
-实现超低功耗的众多电源管理功能。
由于Tegra处理器中的GeForce GPU内核立足于台式GPU,因此GPU的硬件管线经过了优化并且可满足使用PC和游戏机质量图像特性的移动游戏的性能需求。它们还允许开发人员轻松地开发可跨平台运行的游戏,开发人员可以在所有平台上采用相同的渲染技术,然后为各平台添加适当的图形细节和复杂性。
无论是性能还是功耗,Tegra 2均在同期的移动处理器中占尽先机,在提供优秀的图形处理能力、Flash处理速度等最核心的用户体验之外,NVIDIA还联合多家游戏开发商推出有Tegra Zone,为用户提供专门优化的游戏和应用,让Tegra 2的性能得到充分发挥,让手机和平板机用户得到最强的移动体验。
这款处理器在2010年年底由LG推出了首款机型Optimus 2X,并被大量用于新款智能手机和平板机,市场上可见的Android 3.0平板机基本全部使用了Tegra 2处理器,代表手机包括LG P990 Optimus 2X、SU880 Optimus EX、LU8800 Optimus Q2、摩托罗拉Atrix 4G MB860、DROID X2 MB870、MOTO XT882、MOTO MT870。
平板机机型则包括:宏碁Iconia Tab A500、Iconia Tab A100、三星Galaxy Tab 10.1、Galaxy Tab 8.9、东芝THRiVE AT105、戴尔Streak 10 Pro、华硕Eee Pad Transformer TF101、Eee Pad Slider、联想ThinkPad Tablet、乐Pad K1、摩托罗拉Xoom、索尼Tablet P、Tablet S等。
5.2 德州仪器双核代表
德州仪器在2010年第一季度推出了其OMAP移动处理器的第四代产品,首款处理器为OMAP4430,包含有一对1GHz ARM Cortex A9核心和两个Cortex-M3核心,具备SMP对称多处理功能,支持ARMv7指令集,采用45nm制程,共享1MB二级缓存。
该处理器的亮点包括:
1.德州仪器集成了ARM的媒体处理引擎(MPE)以支持NEON技术
2.德州仪器加入了双通道LPDDR2内存控制器,4430可以使用两个RAM内存单元加快存取效率
OMAP 4430集成了Imagination Technologies的PowerVR SGX 540图形芯片,相比上一代的SGX 530有两倍以上性能提升,相比其他厂商将PowerVR SGX 540核心都运行在200MHz上,德州仪器还将其运行在300MHz进行超频。
使用这款处理器的机型包括摩托罗拉Droid 3/里程碑3系列、Droid 4、Droid Bionic、Atrix 2、Droid RAZR、Xoom 2、Droid XYBOARD、LG Optimus 3D、P940 Prada 3.0、P720 Optimus 3D Max、黑莓PlayBook等。
德州仪器于2010年底发布了第二款双核处理器OMAP4440,基于45nm工艺制造,Cortex-A9双核心频率已达1.5GHz。
相比上一款类似架构的1GHz双核OMAP4430,OMAP4440将Cortex-A9双核心的频率提升至1.5GHz,同时还集成了两个Cortex-M3核心用于在更高的能效下处理高时效性应用以及任务管理工作,也包括300MHz PowerVR SGX540图形核心。其图形性能有了25%的提升,网页载入时间可减少30%,1080p视频播放性能提升一倍。
不过这款处理器并未有具体机型使用。
德州仪器的OMAP 4460处理器相当于OMAP4430的升级版,基本架构设计没有改变,但是将主频提升至1.2GHz-1.5GHz,PowerVR SGX540 GPU核心频率从300MHz提升至384MHz,另外升级支持1200万像素双摄像头和1080P 2D/3D摄像。
这款处理器被用于Galaxy Nexus。
OMAP4系列最后一款OMAP4470相比OMAP4460将CPU频率提升了20%,同时集成了全新的PowerVR SGX 544 GPU。
OMAP4470与OMAP4460/OMAP4430同属一个系列,主CPU仍是Cortex-A9双核心,但频率从4430的1GHz,到4460的1.5GHz,再提升到4470的1.8GHz。OMAP4470还集成了266MHz频率的Cortex-M3架构双核,用来处理多媒体和后台任务,同时支持双通道LPDDR2 466MHz内存,拥有更高内存带宽。
OMAP4470的更大进步在于GPU领域,其内嵌图形核心从OMAP4430/4460的PowerVR SGX 540更换为更强大的PowerVR SGX544。其规格类似于iPad 2中使用的PowerVR SGX543MP2,不过iPad 2使用的是双核版本(MP2),而OMAP4470使用虽然是单核版本(MP1),但SGX 544提供了DirectX 9支持。基于渲染管线的成倍提升,再加上GPU频率设定为与OMAP4460相同的384MHz,OMAP4470的理论图形性能可达到OMAP4430的2.5倍。
另一项革新在于加入了硬件图像合成引擎,内置了独立的2D图形核心,可以在不需要PowerSGX 544参与的情况下进行图像合成输出,驱动大屏幕显示并同时保持低功耗,支持如2048x1536分辨率的高分辨率屏幕,HDMI 1.4a 3D输出。
同样目前仍无上市产品使用该款处理器。
5.3 三星双核代表
三星于2010年9月发布了代号为“Orion”(猎户座)的新款双核处理器,基于ARM CORTEX A9核心进行设计,后来在Exynos品牌发布时被定名为Exynos 4210。
该处理器采用三星的45nm低功耗制程技术,内置两个1GHz ARM Cortex A9核心,支持ARMv7指令集,每个核心拥有32KB数据缓存和32KB指令缓存,芯片组还配有1MB的二级缓存来优化处理性能,并提供更快的多任务处理切换速度。此外猎户座的内存接口和总线架构还支持密集型的多媒体应用,包括全高清视频播放和高速3D游戏运行,支持包括NAND flash、moviNAND TM、SSD、HDD等或者同时提供SATA和eMMC存储,厂商也可以选择更高性能的LPDDR2和DDR3内存。
猎户座的芯片中还集成了新的硬件加速器,包括支持录制、播放1080P 30fps高清视频的编/解码器。增强的四核心ARM Mali-400 GPU比三星提供的上一代蜂鸟处理器使用的PowerVR SGX 540 GPU提高5倍的3D图形性能,可以达到30M三角形/秒、275M 像素/秒到1.1G像素/秒吞吐量。
这款处理器的应用机型包括Galaxy S II系列、Galaxy Tab 7.0 Plus、Galaxy Note、Galaxy Tab 7.7、Galaxy Note 10.1、Galaxy Tab 2、魅族MX等。
5.4 高通双核代表
高通是推出应用双核处理器最晚的厂商,包括APQ8060、MSM8260/8660三款CPU都是基于Scorpion双核心架构,采用45nm工艺,主频提升至1.2GHz~1.5GHz,三者之间的区别在所支持的网络规格上。
其第三代Snapdragon手机芯片产品采用双核设计,其中MSM8260支持HSPA+网络,MSM8660支持HSPA+和CDMA2000 1xEV-DO Rev. B网络。这两款手机芯片均内置有两个应用处理器内核,主频均为1.2GHz。
新一代的Snapdragon手机芯片具备有强大的网络应用和多媒体性能,内置有Adreno 220 GPU核心,支持使用Open GLES 2.0和Open VG 1.1技术的3D/2D图形引擎,支持1080P高清视频编解码和24位色WXGA分辨率显示输出,整合低功耗GPS芯片和音频引擎芯片。
第三代Snapdragon处理器最大的特点是支持异步双核工作,每颗核心都负责不同的工作,如果只需要简单的图形计算时,处理器只会开启一颗核心工作,当一个核心负荷不过来时另一个核心才会启动来协同,这可以达到最佳的节能模式。第三代Snapdragon能耗还将降低30%。虽然APQ8060、MSM8260/8660采用双核架构要比单核处理器在性能上要强一半以上。
三代Snapdragon的图形处理核心也升级到性能更强的Adreno 220,三角形输出率、像素填充率分别提升到88M/s、532M/s,性能比上一代Adreno 205提升达50%以上。Adreno 220可以带来多种优秀的图形技术,包括先进的物理粒子和顶点蒙皮、全屏着色处理效果、动态全屏照明Alpha混合、实时仿真贴图、3D动画纹理,以及动态阴影、贴图、反射等着色器。同时第三代Snapdragon在视频解码方面也有极大的改进,可支持1080P视频播放录制,同时内置的GPU芯片可以在解码时保持很低的功耗,并且最大支持24bit WXGA分辨率(1280×800)屏幕。
MSM8260应用的机型包括HTC Sensation、EVO 3D、三星Galaxy S II HD LTE、华为S7-301u MediaPad、联想乐Phone K2、戴尔Streak Pro、索尼(已经没有索爱了)Xperia S LT26/LT26i、Xperia acro HD、Xperia LT28/LT28i、小米手机。
MSM8660应用在HTC EVO 3D CDMA、LG LU6200 Optimus LTE、索尼Xperia acro HD CDMA、小米CDMA等机型。
APQ8060出现在联想乐Pad S2007、三星Galaxy Note LTE、LG Optimus Pad LTE、P936 Optimus LTE、三星Galaxy Tab 7.7 LTE、Galaxy S II LTE等。
5.5 苹果 A5
苹果于2011年3月发布了iPad 2,同时公布这款产品使用了全新的A5处理器,该处理器也在10月份发布的iPhone 4S上得到应用。而帮主,也在iPhone 4S发布之后离世。
A5处理器是由苹果自己设计三星代工生产的一款双核处理器,采用ARM Cortex-A9双核架构,支持ARM v7指令集,使用45 nm制程制作,拥有32 kB指令缓存和32 kB数据缓存,以及1MB二级缓存。二级缓存和总线频率相比上一代A4处理器增加一倍。其中iPhone 4S最高频率为800MHz,iPad 2最高频率为1GHz。
A4处理器中集成的是PowerVR SGX 535,在A5中则升级为PowerVR SGX 543MP2。SGX 543采用模块化设计,单个核心的峰值浮点性能就是SGX 535的两倍,A5的GPU使用的是双核版本,拥有两个SGX 543核心。在iPad 2发布的时候苹果号称图形性能有9倍提升,在iPhone4S发布的时候号称性能有7倍提升。
6.后双核时代
当双核移动处理器的竞争刚刚开始火热的时候,随着28nm技术的来临,移动处理器的竞争开始出现分化,有的开始继续深化挖掘双核潜力,有的厂商已经开始准备推出四核产品,让手机用户们们看花眼的处理器“核变”开始愈演愈烈。
6.1 NVIDIA 抢先四核Tegra 3
NVIDIA公司在2011年初公布ARM架构移动SoC片上系统处理器的未来计划之后,在2011年11月公布了代号“Project Kal-El”(超人原名)的Tegra 3,这也是全球首款移动四核心处理器。
Tegra 3仍采用台积电40nm工艺制造,基于Cortex-A9处理器内核,支持ARMv7-A指令集,四核心最高频率1.3GHz,单核最高1.4GHz,CPU性能最高可达Tegra 2的5倍。
GPU部分,Tegra 3内置了12个核心的ULP超低功耗GeForce GPU(Tegra 2为8核),图形性能是Tegra 2的三倍,可以提供更精彩的3D游戏特效。比如更具真实感的流体效果、物体破坏物理效果、动态模糊等。
除了4核CPU和12核GPU,Tegra 3内部还包括显示输出模块、安全引擎、HDMI输出模块、内存I/O模块、ISP图像处理模块、音频处理模块、高清视频编码/解码器和ARM7管理核心。可支持1080p High Profile 40Mbps高清播放,内存带宽提升至Tegra 2的三倍,图片处理性能Tegra 2的两倍,支持HD Audio 7.1声道环绕声。
其他规格方面,Tegra 3提供32KB+32KB一级缓存,1MB二级缓存,支持DDR3L 1500或LPDDR2-1066内存,最高支持3200万像素摄像头,2048x1536分辨率液晶屏,HDMI 1.4a(1920x1080)输出。台积电40nm制程制造,14x14mm BGA或23x23mm BGA两种封装形式。
关于Tegra 3,我们有必要详细介绍下其设计特色,实际上这款处理器还拥有第五个核心。名为“四核”的Tegra 3实际上内部包含了5个CPU核心,其中一个被称为“Companion CPU core”协核心。NVIDIA将这种架构称为vSMP(可变对称多处理,Variable Symmetric Multiprocessing),已经申请了专利,为了更容易理解,他们还将这种设计命名为4-PLUS-1(4+1)。
Tegra 3中的5个CPU核心在内部结构上完全一致,均为Cortex-A9架构。不过,其中四个采用高性能制程(G)制造,为更高频率运行优化。而最后一个协核心则为低功耗制程(LP)打造,漏电流更低,为低频率运行优化,最高频率仅500MHz。
vSMP架构的特色在于,在“动态待机”(即运行后台进程)和音乐、视频播放时,全部四个主核心皆关闭节能,仅留下协核心运行。而在运行需要更高性能的应用时,则按需逐个开启主核心,同时关闭协核心,切换延迟不超过2毫秒。更重要的是,在操作系统的眼中协核心是不存在的,它只会看到四个性能平衡的核心,而不会发现在单核低负载运行时,实际上已经切换到了更低功耗的协核心上。
具体来讲,在待机状态下运行各种后台任务,邮件、社交网络同步,或是音视频播放工作时,仅开启协核心,频率0到500MHz自动调节,四个主核心则全部关闭。需要指出的是,由于音频、视频都有专门的解码电路辅助,对主CPU的压力并不高,因此即使是高清视频播放也不需要开启主核心。
当开启电子邮件、地图等基础应用,运行2D游戏,查看无Flash网页时,Tegra 3将开启一个主核心,关闭协核心。运行频率在0到1.4GHz间自动调节。浏览含有Flash的网页,多任务运行,视频通话等应用时,开启两个主核心,频率0到1.3GHz。只有在碰到大规模3D游戏,媒体处理,高速浏览网络等需求时,才会开启全部四个主核心,频率仍然可在0-1.3GHz间变化。
NVIDIA表示,相比异步频率等其他多核心节能方案,vSMP有很多优势,比如:
1. 缓存一致性:协核心与主核心共享二级缓存,没有不同频率核心间缓存同步的问题。
2. 操作系统效率:Android系统会认为所有处理器核心运算能力相同,在面对各核心频率不同,性能不等的异步频率架构处理器时,会导致任务分配上的效率低下。而在vSMP中,低功耗的协核心对操作系统是透明的,与主核心间自动进行切换,提高了操作系统任务分配的效率。
3. 功耗:异步频率架构处理器需要给不同核心提供不同的电压和频率,会导致信号和供电线路上的噪声增加,影响性能。多路供电不仅会导致成本增加,也会导致架构更加复杂,限制CPU核心数的增长。而如果为不同频率的核心提供统一供电,则所有核心都必须随最高速核心使用高电压,导致功耗增加。而且合作厂商可以在系统中集成多种电源管理方案,由用户选择开启不同的性能功耗配置,以延长待机时间。
正是有了灵活智能的vSMP架构,四核的Tegra 3能够比双核Tegra 2功耗更低。官方数据显示,高清视频播放时Tegra 3比Tegra 2功耗低61%,网络浏览应用功耗低28%,MP3播放低14%,游戏功耗低15%。与竞争对手的双核产品(OMAP4、8x60)对比,Tegra 3可在480MHz频率,1/3的功耗下实现同等性能,而四核频率提高到1GHz时性能是对手的两倍,功耗仍然低于对手。
四核处理器为PC带来的性能加强大家已经有目共睹,在移动平台上,四核优势的展现要比PC来的更快。特别是在Android平台,多核心带来的体验加强更加直观,在系统底层和应用上对多核心的支持都将会越来越好,无论是系统UI体验、高清游戏还是多线程应用,都会在多核处理器的支持下有更好的表现,而NVIDIA的4+1设计也将会最大程度的满足移动设备的续航要求。
目前已经明确使用这款处理器的产品包括华硕Eee Pad Transformer Prime TF201、Eee Pad Transformer Prime TF300T、宏碁Iconia Tab A510、Iconia Tab A700、LG P880 Optimus 4X HD (LG X3)、HTC One X S720e、东芝AT270、AT330。
6.2 高通S4时代来临
在四核时代已经揭幕的现在,高通自然不能落后,他们不仅要推出新的四核产品,还要全线更新28nm制程,并且最重要的就是:更新架构,好在高通已经公布了这些情况的细节。
高通已经推出了第二代Snapdragon的心脏:全新的Krait架构,这也是所有Snapdragon S4系列SoC的核心,它在Scorpion的基础上作出了不少改进。
在架构的前端方面,Krait显然要更“宽”,一个时钟周期可以执行三次fetch与decode操作。每个Decoder都相当于ARM11的single issue能力模块,对比前代Scorpion的2-wide,能力也提高了50%。后端执行单元方面则是简单的扩张,从Scorpion的三个增加到了七个,可以并行执行4条指令。而在指令执行阶段,Krait终于进入了Cortex-A9阶段,可实现完全乱序执行。
核心架构比较 |
|||||
|
ARM11 |
ARM Cortex-A8 |
ARM Cortex-A9 |
高通Scorpion |
高通Krait |
Decode能力 |
Single-issue |
2-wide |
2-wide |
2-wide |
3-wide |
流水线长度 |
8级 |
13级 |
8级 |
10级 |
11级 |
乱序执行 |
否 |
否 |
是 |
部分 |
是 |
FPU |
VFP11(流水线化) |
VFPv3(非流水线化) |
可选VFPv3-D16(流水线化) |
VFPv3(流水线化) |
VFPv3(流水线化) |
NEON视频解码模块 |
无 |
有(64bit) |
可选MPE(64bit) |
有(128bit) |
有(128bit) |
制造工艺 |
90nm |
65nm/45nm |
40nm |
45nm |
28nm |
典型时钟频率 |
412MHz |
600MHz/1GHz |
1.2GHz |
1GHz |
1.5GHz |
流水线方面,Krait的整数流水线由Scorpion的10级略微提高至11级,对比Cortex-A15的15级流水线,高通的设计含有更多的定制化逻辑模块,同样使得处理器的频率容易提升。
此外,Krait对比Scorpion还支持在A15中才加入的新虚拟化指令集和40bit内存寻址。双核型号的二级缓存也从512KB升至1MB。一个恰当的类比例子是,ARM Cortex-A8时代的设计就像当年的P54C Pentium,而Krait的完全乱序支持就像P6 Pentium Pro,整体设计则是把SoC带入了Pentium II的时代。
在后端完全乱序执行引擎的加持下,Krait架构的预期性能将高于Intel 45nm Atom。2012年面世的部分智能手机可能将拥有超过采用Banias核心Pentium M处理器的初代“迅驰”笔记本的性能。
通常ARM核心性能是用老旧的DMIPS(Dhrystone Millions of Instructions per Second)来衡量,这个老旧的整数性能测试基本与多数读者同龄但在桌面市场早已被弃之不用。但对于架构相同点颇多的各ARM系核心还是有一些意义的。
ARM单核DMIPS/每MHz性能比较 |
|||||
|
ARM11 |
ARM Cortex-A8 |
ARM Cortex-A9 |
高通Scorpion |
高通Krait |
DMIPS/MHz |
1.25 |
2.0 |
2.5 |
2.1 |
3.3 |
Krait的DMIPS/MHz性能为3.3,比同频的Cortex A9快上约30%。预计Krait在发布时将拥有超过目前市面上A9架构CPU约20-25%的性能。依高通推出的频率版本不同,新的智能手机领先市场上A9架构CPU机种的性能达30-50%也不奇怪。目前ARM还没有公布Cortex-A15的性能数据,业界传言在3.5 DMIPS/MHz左右。(从设计角度来看,高通两代核心的定位差不多是这样,Scorpion在A8与A9之间,Krait在A9与A15之间)
在ARM架构SoC中,所有NEON指令都由专用单元去处理。Krait也不例外,高通将这代NEON专用模块命名为VeNum,吞吐容量比之前的Scorpion提高约50%,可同时处理3个NEON指令。高通处理器的NEON数据位宽均为128bit,以上也是为什么采用高通SoC的智能设备解码视频流能力强的原因。
高通Krait核心具有三级缓存结构,低级别的两级缓存为每个核心独享,而第三级别缓存为所有核心共享,高通将每个级别缓存按级别从低至高命名为L0、L1和L2。每个Krait核心具有8KB L0缓存(4KB指令+4KB数据)。L0缓存可在单周期中直接存取,高通称L0缓存有85%的高命中率,使得CPU不必经常访问L1缓存以节省能耗。高通采用的缓存层次结构为独家设计,L0缓存中的数据不必在L1中留有副本。每个核心还具有32KB L1缓存(16KB指令+16KB数据),采用4路组相联设计,同样可以在单周期中访问。L2缓存为所有核心共享,双核Krait中L2容量为1MB,相比之下Scorpion中为512KB;四核Krait容量将进一步上升到2MB,Krait的L2缓存为8路组相联设计。
Krait的缓存结构 |
|||
|
容量 |
架构 |
频率 |
L0 |
4KB+4KB |
直接存取 |
与核心相同 |
L1 |
16KB+16KB |
4路 |
与核心相同 |
L2 |
1MB(双核)/2MB(四核) |
8路 |
最大1.3GHz |
L0与L1缓存频率与核心相同,电压也一样。而L2缓存为省电采用独立设计方式,拥有自己的运行频率,将根据任务负载实时调整,最大为1.3GHz。
内存控制器部分,尽管上代Scorpion内置双通道LPDDR2内存控制器,但通常情况下内存只能利用到其中一条通道。要利用完整的两条32bit通道,必须在PCB上采用两块32bit DRAM封装的形式。由于高通单通道控制器的效率不低,很多OEM厂商都弃另外一通道不用。而Krait解除了这一限制,现在OEM常常可以简单把两个32bit DRAM堆叠在一个封装内即可完整利用双32bit内存控制器,预计在性能上对比Scorpion会有不少提升。
Krait将是世界首个采用28nm制程的智能手机/平板电脑CPU,高通目前的制造合作方包括台积电与GlobalFoundries两家,而前者将制造首个Krait芯片也是制造主力。因高通考虑采用TSMC的非HKMG工艺会有更小的风险,Krait前期将采用台积电标准28nm LP工艺制造。在高通白皮书PDF给出的对比图中,Krait核心MSM8960的对比对象为NVIDIA采用40nm LPG混合工艺的Kal-El。高通对于制造工艺的态度是,40nm G晶体管只有在全程高频时才有意义,其余多余情况下纯LP工艺晶体管三个更有优势。
和Scorpion一样,Krait每个核心也有自己的独立频率/电压控制机能。高通称这种设计可在多种不同负载率下拥有功耗优势。
首个使用Krait核心的高通SoC为双核1.5GHz的MSM8960,明年该CPU预计将推出制程进一步改进的版本,频率可达1.7-2.0GHz。高通称当Krait与Scorpion核心电压同为1.05V时,Krait的极限频率为1.7GHz,相比之下Scorpion最多只能达到1.55GHz;此时运行相同的某个任务时Krait的功耗为265mW,Scorpion 432mW。虽然满载时Krait可能会比Scorpion消耗更多的电能,但总体上来说Krait运行任务效率高,进入待机状态时功耗下降速度快,总体看来电源管理方面对比上代Scorpion还是有所提高。以此推算,智能手机与平板电脑的实际续航即使没有改进,最坏情况也是与之前持平。
L0与L1缓存频率与核心相同,电压也一样。而L2缓存为省电采用独立设计方式,拥有自己的运行频率,将根据任务负载实时调整,最大为1.3GHz。
Snapdragon S4处理器已经公布的有:双核MSM8960及8x60系列、双核MSM8930及MSM8x30系列、四核APQ8064,全部采用最新架构。
该系列首款产品MSM8960目前已经进入生产,该处理器基于台积电28nm LP工艺制程,拥有2个Krait核心,运行于1.5-1.7GHz。MSM8960整合Adreno 225GPU与双通道LPDDR2内存控制器,内存频率最高500MHz(等效1GHz),支持2000万像素摄像头。此外作为MSM系列的龙头产品还整合有高通自家3G/4G/LTE全模基带。
之前高通向来很少透露SoC中集成的GPU细节,从MSM8960开始这一情况得到了改变:该SoC采用的Adreno 225 GPU是明年Krait改进版采用新架构的Adreno 3xx前最后一代老架构产品。
从ALU上来看,Adreno 225的规格等于Adreno 205的2倍。所有Adreno 2xx家族图形核心均为DirectX 9.0级别,Adreno 225与其他主流SoC中采用的图形核心对比如下:
常见SoC芯片GPU比较 |
|||||||
|
Adreno 225 |
PowerVR SGX540 |
PowerVR SGX543 |
PowerVR SGX543MP2 |
Mali-400 MP4 |
GeForce ULP |
GeForce++ (Kal-El) |
SIMD名称 |
- |
USSE |
USSE2 |
USSE2 |
Core |
Core |
Core |
SIMD对应数据流数量 |
8 |
4 |
4 |
8 |
4+1 |
8 |
12 |
每SIMD的MAD数量 |
4 |
2 |
4 |
4 |
4/2 |
1 |
? |
总MAD |
32 |
8 |
16 |
32 |
18 |
8 |
? |
运算能力(GFLOPS)@200MHz |
12.8 |
3.2 |
6.4 |
12.8 |
7.2 |
3.2 |
? |
运算能力(GFLOPS)@300MHz |
19.2 |
4.8 |
9.6 |
19.2 |
10.8 |
4.8 |
? |
从表中可以看出Adreno 225的理论运算能力与iPad2中苹果A5 SoC的PowerVR SGX543MP2相当。此外,与MSM8660中266MHz的Adreno 220相比,Adreno 225得益于28nm制程的优势,频率提升到400MHz。另外,高通还称Adreno 225在驱动层面上做出了显著的改进。两点结合使得Adreno 225要比Adreno 220快上50%。此外,目前Adreno 225还只支持Direct3D feature level 9.3级别的效果。
MSM8960支持几乎世界所有网络制式,它集成的基带芯片基于高通第二代(3GPP rel.9)LTE MODEM,与MDM9x15中的几乎一样。这也是苹果为什么还没有推出LTE版iPhone的原因(等待高通28nm基带芯片)。以下是Snapdragon S4 MSM8960支持的所有制式:
- FDD-LTE(100Mbps下行/50Mbps上行)
- TDD-LTE(68Mbps下行/17Mbps上行)
- UMTS/HSPA+ (42Mbps下行/11Mbps上行)
- CDMA2000 1x Advanced,EVDO Rev.B (14.7Mbps下行/5.4Mbps上行)
- TD-SCDMA(4.2Mbps下行/2.2Mbps上行)
- GSM/GPRS/EDGE
此外,MSM8960中的基带部分比起高通现有LTE MODEM的MDM9600,还接近于完整支持VoLTE,即语音通过LTE网络传输。另外802.11 b/g/n WiFi、蓝牙和GPS功能当然也在新的SoC支持范围内。
已经确认使用该款处理器的产品包括:HTC One X LTE/One XL、联想IdeaTab S2、华硕Padfone、华为Ascend P LTE、Ascend D LTE。
8x60系列的MSM8660A与MSM8260A,与MSM8960的唯一区别在于集成的基带不支持LTE。还有不整合任何基带的APQ8060A。
定位稍低的MSM8930拥有2个Krait核心,运行频率最高1.2GHz。内存控制器降为单通道LPDDR2但频率提升为533MHz(等效1066MHz),最大支持1350万像素摄像头。此外,MSM8930还将集成高通新一代GPU Adreno 305,正式亮相时间相应推后。
MSM8930也支持LTE,如果厂商不需要用到相应部分想降低成本自然可以选择8x30系列的MSM8630、MSM8230或不含基带的APQ8030。
面向低端的8x27系列中,MSM8627与MSM8227也是双核Krait架构,运行频率最大1GHz,采用单通道LPDDR2 400MHz控制器(等效800MHz),视频解码NEON模块能力降至720p,搭载的GPU可能是和MSM8960相同的Adreno 225。
最强的APQ8064四核SoC目前频率限定为1.7GHz,不过高通以前已经透露可能会提升至最高2.5GHz。此外,APQ8064集成DDR3-1066内存控制器,以及on-die SATA和PCI-E主控,内置有下一代的Adreno 320 GPU核心。
6.3 德州仪器下一代处理器
德州仪器于2011年2月份发布了新的双核OMAP 5 Soc处理器,相比已有的OMAP 4系列使用的双Cortex A9核心,OMAP 5系列将升级双ARM Cortex-A15核心,并采用28nm工艺生产。虽然德州仪器没有推出四核产品,但是其新款处理器依然有不少亮点。
ARM-Cortex A15处理器内核理论主频高达2GHz,最终产品具体频率会因OEM厂商的决定产生变动。德州仪器表示,双Cortex-A15核心在2GHz运行时,将会比内置1GHz Cortex-A9双核心的OMAP 4330处理速度高出三倍。在相同的频率下,A15相比A9也能带来15%-50%的性能优势。
在OMAP 3中,德州仪器为单核Cortex-A8设计了256KB二级缓存,OMAP 4则上升了4倍,两个Cortex-A9核心共享1MB二级缓存,OMAP 5则将二级缓存升到了2MB。OMAP 5还保留了LPDDR2双通道内存接口。
OMAP 5将会内置Imagination Technologies的PowerVR SGX 544双GPU内核,新内核将具备4个USSE2管道,SGX 540中是4个USSE管道,SGX 530中则只有两个。SGX544内核通过采用块状延迟渲染架构实现与同类竞争方案的差异化,可减少带宽使用,最大限度地降低功耗,OMAP5将其运行在532MHz频率。此外该架构还拥有专用的2D硬件加速合成引擎,无需使用外部存储器便可支持多达8层的高分辨率合成,可有效扩增SGX544内核性能。智能多内核系统可将合成任务移交给合成引擎完成,与GPU在运行相同8层合成过程时相比,可将功耗降低10倍。
德州仪器发布的两个OMAP 5具体产品分别是5430和5432,其中OMAP 5430封装大小为14×14mm,支持LPDDR2内存,将用于智能手机产品,OMAP 5432的封装大小为17×17mm,支持DDR3/DDR3L内存,更适合于大尺寸平板设备使用。
OMAP 5架构的独特设计之处在于,除了两个ARM Cortex-A15内核之外,还增加了两个ARM Cortex-M4内核,这两个M级内核可以分配实时控制视频编解码等各种多媒体处理任务,将主CPU内核解放出来管理高级操作系统任务。除了能减少Cortex-A15内核中断率之外,这种负载分担功能还可实现节能作用,比如在编解码高清H.264内容时,系统功耗可以降低10%。
影像技术方面,OMAP 5平台的影像信号处理器不但可实现快速捕获,以零快门滞后支持0.5秒16MP与30fps 24MP的速率,而且还可提高低光性能。此外,它还允许设备同时使用4个摄像机传感器实现最新终端用户应用。例如,使用OMAP 5处理器设备的用户在捕获1080p 60fps视频的同时,还可拍摄12MP的静态影像。TI高级摄像机API 将支持夜景拍摄、高级HDR以及数字再对焦等新特性。
目前还没有设备确认使用该系列处理器。
6.4 三星下一代处理器
三星下一代的产品是已经公布的Exynos 5250双核处理器,这将会是下一批三星移动设备的核心。
Exynos 5250采用32纳米工艺,双核Cortex-A15架构设计,工作频率2.0GHz,支持ARMv7指令集,拥有32KB指令缓存和32KB数据缓存以及1MB二级缓存,采用128-bit多层总线架构,计算性能是三星1.5GHz 双核Cortex-A9架构Exynos4210的2倍。
Exynos 5的GPU部分为ARM下一代"Midgard"架构的Mali-T604 MP4四核心GPU,拥有2.1G/s的像素渲染率,同时64bit内存控制器提供的带宽可达12.8Gbyte/s,最大支持2560x1600像素显示输出。有可能会分为双核心GPU版和四核心GPU版。
Mali-T604基于三星自家的32nm LP HKMG制程工艺,不仅大大提升了性能,还转向了基于Shader的模式,拥有4个Shader核心,更接近现代A卡N卡,因此编程更加简单,也能用在游戏之外的其它图形领域。硬件规格方面,Mali-T604完整支持DirectX 9/10/11、OpenCL 1.1、DirectCompute,完整的64bit精度浮点运算功能,并确认支持曲面细分技术。
此外该处理器提供两个32-bit 800MHz LPDDR3/DDR3接口和两个32-bit 533MHz LPDDR2端口,集成多格式视频硬件编解码器,可以实现MPEG-4/H.263/H.264格式1080p 60fps视频的编解码和同质量MPEG-2/VC1/VP8视频的解码。
四核版的Exynos 5450仍在传闻中。
另外三星还有两款不为人知的处理器,其中Exynos 4212为Exynos 4210的升级版,仍为ARM Cortex-A9双核架构,内置Mali-400 GPU核心,但是升级32 nm工艺制作,主频1.5GHz,相比Exynos 4210省电30%,性能加强25%,3D渲染性能提升近50%左右。
虽然这款处理器目前没有设备应用,但是其四核升级版本Exynos 4412被传将用于Galaxy S Ⅲ和魅族四核版MX。
6.5 苹果的A5X
随着新一代牛排(iPad 3)的发布,苹果最新的A5X也已经亮相,但是苹果并未公布这款新处理器的详细规格参数,我们只能从网上的分析来看一下这个处理器的一些信息。
A5X处理器理论上应该还是双Cortex-A9架构核心,支持ARMv7指令集,主频为1GHz,可能仍然采用45nm制程。
GPU性能信息更加详细一些,A5中整合的是PowerVR SGX543MP2,A5X则换成了四核心PowerVR SGX543MP4,也就是从“双核”升级为“四核”,每个时钟周期内执行的MAD计算数量从32个翻番至64个,不过时钟频率保持为250MHz,因此浮点性能也从16GFlops升至32GFlops。
7.融合式的未来
看完这些之后,大家可以发现移动处理器产品的发展已经经历了生产工艺、核心架构、GPU、网络支持等功能的不断进化。
在今年以及2013年中,四核处理器、多核GPU、28nm、1GHz-2GHz、1080P高清视频、3D显示等都将会成为新款手机或者平板机的卖点。搭载NVIDIA Tegra 3四核处理器的平板机去年年底已经抢先铺货上市,多款手机产品也就要和大家见面了,较对手们提前半年开始了普及多核攻势。而高通的S4产品线布局已近完成,德州仪器则放出了OMAP5 A15双核激战A9四核的视频来预热,只是由于它们尚无实际产品上市,无法对其性能过早下定论。
战场的另一边,苹果仍然注重体验而非技术,但在来势汹汹四核机群面前,新iPad保持双核,仅升级GPU的路子似乎过于保守导致缺乏卖点,买气不足引黄牛纷纷退货似乎已经印证了这点。技术更新的浪潮,已经不允许任何人有丝毫的懈怠。
在各家处理器的最新设计架构上可以看到,在核心处理器、GPU引擎等设计中,移动处理器正在保持低功耗的同时开始接近PC平台,让跨平台开发的难度大大降低。
从微软的蓝图我们可以看到,未来Windows将会横跨PC、平板、手机三大平台,Android系统也将有望发展出更多的专业性功能来替代PC,苹果的强势已经在侵吞原有的PC市场。
无论如何,这些移动操作系统都将会逐步于PC进行融合,最终将不会有PC设备和移动设备的区分,移动处理器也将会在这个过程中发挥自己强势推动作用。
你可以想象,未来,皆可移动。