【PConline 首发评测】在一段时间的翘首期盼之后,NVIDIA新一代的旗舰级显卡GTX980/970终于要揭开自己的真面目了。光给人带来全新GPU效能比概念的Maxwell架构引入高端产品这一点就非常诱人了,是否能在实现性能提升的同时实现功耗的降低呢?这些让我们对这款产品充满了期待,究竟这款次世代旗舰级显卡真实设计怎样,性能表现又怎样呢?别急,小编将为你一一解答!
回顾之前旗舰显卡的竞争,虽然NV凭借开普勒架构的威力在单芯显卡的性能之战中成功压制了AMD,但是在单卡双芯的卡皇之战中却不小心输给了大胆将水冷引入公版卡(AMD R9 295X2)设计中的AMD。这对于旨在必得的NVIDIA绝对是一记难以释怀的打脸,这也促使一直憋着一口气的NV终于下定决心将在中端显卡中表现出色的Maxwell架构引入高端平台中。这也可以说是NV的翻身之仗,究竟Maxwell架构和旗舰级显卡会迸溅出怎样的火花呢?请继续往下看。
Maxwell架构究竟为我们带来了啥?
Maxwell架构的特点其实非常简单,就是超高的能效比。与上一代的开普勒(Kepler)架构相比,在制造工艺不改变的前提下可以实现2倍的能效比。这也标志着显卡从单一的性能增长转变为能耗比和性能的同步增长。(点击查看详细资料)
GTX980/970将加成什么新技术?
NV这次公布的技术可谓是个个重量十足,首先是能在不改变分辨率的情况下提升显示效果的DSR(低分辨率优化)技术;其次是全新的MFAA抗锯齿技术,能保证MSAA的效果但是提高性能;还有对画质影响极大的光线追踪技术,技术DEMO中的效果十分惊人;最后是针对目前非常热的虚拟现实设备的显示优化。可以这样说,这里面的很多技术将使得显示效果提升到另一个层次上,为用户带来完全不一样的体验。(点击查看详细资料)
GTX980/970究竟长啥样?
事实证明之前许多的泄露并不是空穴来风,这次GTX980将延续自GTX TITAN开创的外观和散热设计。至于GTX970吗,这个NV表示我们不出公版,之前剧透应用GTX760外观和散热设计的只是一款原型。虽然没什么改变,但相信散热性能方面绝对是足够用了。
NVIDIA GTX980(公版)
而且GTX980公版的辅助供电也确如之前泄露出来的6+6pin设计,光看供电很难想象这是一款旗舰级显卡。不管怎样,这张卡的实际功耗低于225W是板上钉钉了。除此之外的改变要数增加的背板和输出接口了,背板与GTX TITAN Z上的设计比较接近,线条感十足。而显示接口首次增加到5个,采用了从未见过的DVI+HDMI+全尺寸DPx3的5接口组合,输出能力十分强大。
影驰GTX970黑将(非公版)
由于NV不做GTX970公版,我们在本次测试中将使用AIC影驰提供的非公版GTX970 黑将来进行测试。
GTX980/970规格参数看个透!
GTX980/970参数规格对比
显卡:GTX770:GTX780:GTX780Ti:GTX970:GTX980
架构:GK104:GK110:GK110:GM204:GM204
晶体管数:35亿:71亿:71亿:52亿:52亿
制作工艺:28纳米:28纳米:28纳米:28纳米:28纳米
流处理器:
1536
:2304
:2880
:1664
:2048纹理单元:128:192:240:104:128
ROPs:32:48:48:32:64
显存容量:2GB:3GB:3GB:4GB:4GB
显存位宽:256bit:384bit:384bit:256bit:256bit
核心频率:1046-1085MHz:863-902MHz:876-928MHz:1051-1178MHz:1126-1216MMHz
Boost幅度:3.7%:4.5%:5.9%:12.1%:8.0%
显存频率:6008 MHz:6008 MHz:7000MHz:7012MHz:7012MHz
外接供电:8+6pin:8+6pin:8+6pin:6+6pin:6+6pin
规格点评:和上一代开普勒结构的三款显卡对比,我们可以发现GTX980/970的规格基本都是“缩水”的。就连流处理器,纹理单元,显存位宽这些一般认为与显卡性能息息相关的参数都大幅低于上一代,唯一能算作提升的只有boost状态下的频率提升幅度和显存容量提升算是升级了。这样的规格真的能做到性能提升么?让我们用实践来验证一下吧。
相关阅读:
送影驰GTX970!看GTX980/970显卡发布直播http://live.pconline.com.cn/306.html
1分钟就读懂!GTX980/970显卡专题http://www1.pconline.com.cn/diy/NVIDIA2014/
我要分享!一图看懂GTX980/970显卡http://www1.pconline.com.cn/mobile/appzhuanlan/gtx980/index.html
拆拆拆!GTX980拆解对比
既然外观没有改变,那么拆解之后是否会有什么惊喜呢?PS:前方高能,多图杀猫,点击小图还可以欣赏高清大图!
小编总结:可以这样说,在硬件规格上GTX980与GTX780相比并没有什么提升,反而在许多设计细节和用料上有所缩水,这些是否会影响到这张卡的实际性能表现呢?让我们在后面的性能测试中一探究竟。
还想跑?!拆完GTX980继续拆GTX970
因为GTX970也采用了前辈GTX760类似的无“公版”策略,所以本次测试中我们将采用影驰GTX970黑将作为测试对象,
拆解小结:因为是非公版与公版的对比,所以很多地方并不具备直接对比的能力,更多的是想借助这款产品来提前让大家了解即将到来的GTX970非公版将会是个什么样子。
测试平台说明
硬件平台
CPU: Intel I7 4770K
主板: 华硕Z97-DELUXE
内存: 海盗船 DDR3 1600 8GB×2(8-8-8-24)
硬盘: 西部数据1TB 64M SATA3
电源: ANTEC 1300W HCP Platinum
显卡:
NVIDIA Geforce GTX980(1126/7012MHz)
NVIDIA Geforce GTX970(1051/7012MHz)
NVIDIA Geforce GTX780Ti(876/7000MHz)
NVIDIA Geforce GTX780(863/6008MHz)
NVIDIA Geforce GTX770(1046/6008MHz)
AMD R9 290X(1000/5000MHz)
AMD R9 290(947/6008MHz)
软件平台
操作系统: Windows 7 +DirectX 11
显卡驱动: NVIDIA ForceWare 344.07(NVIDIA官方提供) AMD催化剂14.7RC
测试平台说明:平台方面还是一贯的i7-4770K+Z97的组合,这次测试中我们一共用了5款起他显卡进行对比测试,其中除了GTX780/770之外还有目前NV旗舰GTX780Ti,以及AMD最强力的两员大将R9 290X/290。废话不多说,让我们走进理论测试环节。
理论测试
GTX970的3DMark11/新3DMark成绩截图
GTX980的3DMark11/新3DMark成绩截图
测试小结:在首先进行的3DMark理论测试中,GTX980/970可谓是锋芒毕露,GTX980毫不费力的超越了自己的前辈GTX780Ti,而GTX970也是轻松超越了GTX780,在新3DMark的测试中甚至逼近了GTX780Ti,整体成绩非常出彩。那么是否意味着游戏性能也会实现大幅超越呢?请继续往下看。
扩展阅读:3D理论测试设置
测试软件 设置
软件
:设置
《新3DMark》
:Fire Strike场景Extreme模式
《3DMark 11 V1.02》
:Extreme
游戏测试——第一部分
我们首先来测试以下四款游戏:《古墓丽影9》、《地铁:余光》、《热血无赖》、《孤岛惊魂3》。
测试小结:这四款游戏中很明显在《古墓丽影9》和《热血无赖》中,GTX980并未想预想中一样拉开与GTX780的差距,很有可能是因为驱动优化的问题。但在《孤岛惊魂》、《地铁:余光》中,GTX980较GTX780都有明显提升。
1080p分辨率下 所测试游戏的设置和测量方式
游戏:游戏设置:测试方法
《古墓丽影9》:最高画质,1920x1080:游戏自带基准测试
《地铁:最后的曙光》:Very High画质+AF4X:自带Benchmark
《热血无赖》:最高画质, 高抗锯齿,1920x1080:自带Benchmark
《孤岛惊魂3》:DX11,最高画质:用Fraps软件记录猎杀野猪及采集三色药草后移动到下一个海盗营地场地
游戏测试——第二部分
4款游戏怎么可能够,再来四款!《孤岛危机3》、《细胞分裂6》、《看门狗》、《使命召唤10》再战GTX980/970。
测试小结:在著名的“显卡危机”中,GTX980/970再次受到了驱动的干扰,GTX970的表现连GTX780都不如,相信这个问题会在产品正式上市前后得到解决。在其他三个游戏中,GTX980/970的性能终于展露无遗,在COD10中更是超越了接近20帧的巨大幅度,新一代显卡杀手《看门狗》测试中,GTX970的成绩已与GTX780Ti基本持平。
1080p分辨率下 所测试游戏的设置和测量方式
游戏:游戏设置:测试方法
《孤岛危机3》:最高画质,1920x1080:用Fraps软件记录这“欢迎来到丛林”关卡,仅直线行走草丛的平均帧速。
《细胞分裂6》:最高画质,4MSAA,关闭物理加速,1920x1080:Frps软件采集,单人战役-飞机跑道关卡开始的即时演算动画,约35秒
《看门狗》:ultra画质,4X抗锯齿,1920x1080:用Fraps软件记录“逃离球场”关卡,从开始到车库的平均帧率。
《使命召唤10》:最高画质,MSAA4X抗锯齿,1920x1080:使用Fraps,“Brave New World”关卡从画面渲染开始至直升机坠地
平台功耗测试
为了更加贴近玩家日常应用中的真实场景,同时也更加全面的了的GTX980/970的功耗优势到底在哪里,我们将采用三种方式来对平台功耗测量,分别是Furmark拷机、游戏拷机以及网页浏览状态下。
测试小结:测试结果很明显,无论是在Furmark满载亦或是实际游戏中的平台功耗,GTX980/970均大幅小于前辈们,幅度接近80W。要是考虑到本身平台的功耗在70W左右,GTX980的实际功耗可能会比GTX780Ti低接近30%,这不能不说是一个非常惊人的数字。而网页浏览状态下的功耗还是维持了原本的水准,属于正常发挥。
显卡温度测试
显卡温度测试中主要是要考量显卡在极限状态下的温度,所以直接利用Furmark软件进行拷机。
测试小结:GTX970以影驰GTX970的数据作为参考。可以看到虽然功耗大幅降低,但是显卡的温度并没有太大变化,这个很可能与NV公版BIOS中预设的风扇转速表以噪音大小为主要考量因素的原因。
显卡噪音测试
这里的噪音测试对公版GTX980和影驰GTX970在Furmark拷机状态下的风扇噪音进行测量。
测试小结:公版由于没有什么改变,自然在噪音表现上也没有什么进步,不过涡轮风扇的性能还是不错的。而影驰GTX970在噪音测试中的成绩则比较出色,两个大直径散热风扇在高转速下也只有50.5分贝的噪音大小,值得表扬。
百科小知识:
0 -20 分贝:很静、几乎感觉不到;20 -40 分贝:安静、犹如轻声絮语;40 -60 分贝:一般普通室内谈话;60 -70 分贝:吵闹:有损神经;70 -90 分贝:很吵、神经细胞受到破坏。90 -100 分贝:吵闹加剧、听力受损;100 -120 分贝:难以忍受、呆一分钟即暂时致聋。120分贝以上:极度聋或全聋;300分贝左右或以上:方圆20km的人不可修复性耳聋。
扩展阅读:功耗温度测试方法
超频测试3D理论测试软件 设置
测试项目:设置
Furmark:1920x1080 benchmark 15min
《孤岛惊魂3》
: 记录猎杀野猪及采集三色药草后 移动到下一个海盗营地场地的功耗中间值网页测试:
IE浏览器中刷新太平洋首页取功率峰值的平均数
噪音计:环境噪音:44分贝
附加测试1:4K游戏测试
4K显示规格已经开始在普通消费者中开始普及,所以4K分辨率下的游戏体验也是非常有参考的意义,考虑到可玩性(要保证30帧左右),游戏设置不开到极限。
测试小结:可以看到在4K分辨率的超强压力下,GTX980反而进一步拉大了与GTX780Ti/780之间的性能差距,这个主要是由于全新的Maxwell架构在高负载下性能损失较少导致的,相信随着驱动的进一步优化,这个特点还会进一步的明显。
4K(3840x2160)分辨率下 所测试游戏的设置和测量方式
游戏:游戏设置:测试方法
《孤岛危机3》:中画质,中系统规格,关闭抗锯齿,3840x2160:用Fraps软件记录这“欢迎来到丛林”关卡,仅直线行走草丛的平均帧速。
《孤岛惊魂3》:DX11,最高画质,3840x2160,抗锯齿2X:用Fraps软件记录猎杀野猪及采集三色药草后移动到下一个海盗营地场地
《看门狗》:ultra画质,关闭抗锯齿,3840x2160:用Fraps软件记录“逃离球场”关卡,从开始到车库的平均帧率。
附加测试2:超频测试
小编在评测同样采用Maxwell架构的GTX750Ti的时候就领教过其强大的超频能力,这次GTX980的表现更是让小编有些始料不及。在没有升高核心电压的前提下,通过直接拉升核心频率,我们很顺利的将核心的频率提升了150MHz,基础频率上升到1276MHz,Boost之后的频率更是达到了1366MHz的高度,而且表面上无任何不良反应。
测试小结:小编只是小试牛刀,默电随便拉150MHz的频率还是很厉害的。对GTX980/970超频性能感兴趣的朋友们可以继续关注我们以后的相关评测。
评测成绩总结:次世代的旗舰级显卡
对上面游戏测试的成绩进行计算后,我们可以得到如上一个性能百分比。可以看到,但是GTX980/970的实力确实不俗,不在于绝对性能提升很大,而是在性能上涨的同时功耗反而有所下降,再次证实Maxwell架构的设计初衷。
PConline显卡天梯图
天梯图说明:GTX980/970性能都非常出色,其中GTX970与对手的AMD R9 290X不相伯仲,而GTX980也成功夺下了NV的单芯显卡旗舰宝座,所以两者在显卡天梯图中的排名如图。
PConline总结:NVIDIA在下一盘很大的棋!
整体评测下来之后,GTX980/970给小编带来的惊喜不只一两个,最大的感受就是Maxwell架构标志着显卡发展正式从单一的性能增长,转为功耗与性能并重。同时高效能的核心对NV来说,小核心、用料可相对精简,带来更大利润空间,AMD短只是还只能陷入价格战的泥潭。要知道目前Maxwell架构还只是采用28nm制程,假想如果与最新的20nm、甚至14nm结合,又会擦出怎样的火花?(这画面太美我不敢想)
注重能耗比,也是未来IT产品发展的必然方向。对,不止PC,是IT所有产品,我们认为:Maxwell架构的GPU将在笔记本、平板、手机等产品上使用,以GPU优势牵动行业发展,NVIDIA在下一盘很大的棋!
AMD将如何应对?
显卡的竞争,显卡的更新换代并不是独角戏,如果没有竞争对手,那么我们也不可能感受到每年更新一次的高端显卡刷新率。AMD这边会有怎样的行动呢?
顶级显卡大降价是AMD常见的手段
其实在Maxwell发布前AMD已经闻到杀戮的味道,于是将旗下的旗舰显卡大幅度降价。R9 290X只要2.5k就能收入手,而目前最强的游戏显卡R9 295X2目前只需要4位数,性价比远超竞争对手的产品。同时完全扫除挖矿带来的负面影响,继续做DIY玩家的良心价格,高性价比形象继续维持。
在降价的同时AMD也继续准备着它的新产品研发。从目前泄漏出来的消息来看,AMD的下一代产品R9 390X很有可能采用混合水冷方案,R9 295X2的成功似乎带动了AMD重走高性能高功耗的道路?同时R9 390X很有可能会带来下一代的显存技术HBM显存技术,这是AMD主导的3D堆栈显技术。可惜的是2014年我们很有可能无法见到AMD下一代旗舰显卡,只能等待吧。
坐等Maxwell最强形态(要等下一代了...)
GTX980/970让大家体验了Maxwell的真正威力,2048个CUDA核心的保守设置就能侧面看出NVIDIA对Maxwell的信心。改进的SMM单元配置,让CUDA核心的利用更加高效,从而为GTX980带来更强的效率。在对比测试中,Maxwell中处于中端地位的GM204打败上一代Kepler完全体GK110就是证明。
特别强调的是,GTX980/970超高的性能功耗比让我们对高端显卡的印象进一步刷新,原来顶级显卡的功耗还可以这么低的,仅是GTX760千元级显卡的水平。符合当前环保节能的潮流,值得推广。
NVIDIA GTX980/970 优缺点点评
优点:缺点
1、应用Maxwell架构 2、性能较上一代提升30% 3、能耗比提升幅度巨大 4、超频潜力很大 5、N个新显示技术加成
:1、公版散热可以做的更好 2、绝对性能相比上代提升不算大
要说GTX980/970有什么缺点的话,就是绝对性能提升不算大,难以打动GTX780系列用户升级。不顾根据GTX680/670的经验,这次GTX980/970维持前辈们的定位。首先火速替代上一代高性能高功耗的旗舰产品,然后通过超高性能功耗比的优势打动玩家,提高影响力,打压竞争对手。吸收销量、市场占有率的同时为下一版本的顶级单卡做好充分准备。
当然,我们不会忽略Maxwell的完全体GM210这性能怪兽的存在,就如两年前的GTX680就是GTX780Ti的前奏一样。见识了GM204的威力后,我们更有理由期待Maxwell最强一面展示给大家的那一天。
附加阅读1:NVIDIA三代DX11架构回顾
DirectX 11走过了四年的发展道路、三代的显卡变迁。今天,我们首先回顾下NVIDIA三代DX11架构,温故而知新。
2010年:Fermi架构
Fermi架构
在DX10时代取得全面胜利后,NVIDIA似乎重蹈骄兵必败的覆辙。进入DX11时代,反而被AMD-ATI抢得先机,2009年年底,HD5870成为了第一款DX11显卡,而HD5970更火速上市占据了显卡性能王者地位。而N饭苦等半年,NVIDIA才正式回击,发布GF100架构。
GF100核心属性
完整的GF100核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存。当然,DX11技术是完整支持的。有趣的是,当时曾出现A/N两家关于真假DX11风波的口水战,不过结果不了了之。
火炉级的GTX480
令人意外的是,GF100架构并不是Fermi的完全体,CUDA核心(流处理器)为480个,也就是在GF100原有的512个屏蔽一组SM得来。究其原因,无疑就是当年DIY玩家津津乐道的煮鸡蛋嘲讽。
当年中端神器GTX460
有意思的是,虽然NVIDIA在顶级显卡竞争中遭遇滑铁卢,但是精简通用运算回归游戏性能的GF104架构,在中端市场中却取得了成功,GTX460成为了当年的一代神卡。逢6必火定律不胫而走。
大核心战略让NVIDIA吃尽苦头
逐步解决了核心工艺问题后,2011年Fermi的完全体终于出现了,NVIDIA命名为GF110,新一代的GTX580终于带来了完整512个CUDA核心。同时,改进核心工艺,让双芯显卡的难产期终于结束,GTX590终于面世。但吃尽苦头的NVIDIA,已经与大核心告别了。
2012年:Kepler架构
GK104核心属性
臭名昭著的GTX480、一代神卡的GTX460,两者的巨大反差,让NVIDIA深深感受到游戏显卡玩通用运算的道路是走不通的,于是将下一代架构的研发专注在3D性能上。虽然第二代DX11架构的抢注上NVIDIA再度落后给AMD,但这次,NVIDIA的Kepler架构却赢得了掌声。
GTX680显卡的GPU
GK104采用了一种“简化CUDA核心”的设计方案。GK104的1536个流处理器,被划分为8个SM单元,每个SM单元内部具有192个流处理器,密度非常大。“开普勒”还在架构内部加入一些固定功能的模块,以提升光栅化、纹理渲染性能,统一调配流处理器的任务分派。“开普勒”还支持全新的GPU Boost 技术,能够动态调节运行频率,针对性能与功耗作出动态调整。
Kelpler的完全体:GK110
相信大家对第一代Kelper顶级显卡GTX680的印象是:老黄真不厚道,竟然将中端架构放高端卖。但事实是,原本定位中端的”GTX670Ti“却能打败HD7970,于是出现了GK104更名GTX680坐镇高端。GK110作为Kepler的Reflash成为后来的BOSS:GTX780系列。所以,GK110才是Kepler的完全体,在性能的竞争中一直领先对应AMD的相应竞争对手。
那时NVIDIA大力宣传性能功耗比
Kepler架构的意义在于拨乱反正,让NVIDIA重新认识到显卡只为游戏服务的初心,小核心的思路主导着显卡市场的发展。
2014年:初代Maxwell架构
相隔Kepler架构出世已经有两年,所以下一代Maxwell架构是时候上场了,但是Kepler完全体2880SP的GK110却露面较晚,库存还得慢慢消化。于是初代Maxwell架构首先在主流级显卡市场进行实践,这也是新架构首次在中端显卡中露面。
Maxwell架构属性
虽然是基于新架构,但NVIDIA官方称之为Maxwell初代,相比起之前的Kepler架构,Maxwell的变化也是显而易见的。
GM107核心
以往Kepler架构,1组SMX由一个控制逻辑附带192个CUDA单元组成,控制逻辑太少以至造成CUDA冗余。现在1组SMX却是由四个控制逻辑,每个控制逻辑附带32个CUDA单元,更合理分配控制逻辑和CUDA的数量,效率更高,在相同制成下功耗更低。
Maxwell超高的性能功耗比令人惊喜
相信初代Maxwell架构给人最大的印象无疑就是它超越同时代的性能功耗比了,999元上市价的GTX750Ti竟然是网卡做工,让人十分意外。当然,这才是显卡发展的正确道路。有初代Maxwell架构的铺垫,相信大家会对旗舰级Maxwell架构会更加期待。
附加阅读2:解读崭新Maxwell架构
如果说年初GTX750系列的发布是Maxwell的预演的话,那今天GTX980的横空出世就是Maxwell展现真正实力的时候了。
GM204架构规格
对比GK104架构
这次发布的Maxwell架构代号为GM204,按照上一代Kepler架构的传统,GM204是Maxwell属于次高端的架构,但是由于性能在目前顶级显卡对比中处于优势,所以NVIDIA维持GTX680的做法,将GM204打扮成GTX980作为新一代高端产品线出现。而Maxwell的完全体GM210,要等到下一年的产品线更新中才露面。
GTX980采用的是完整的GM204架构,该架构内置52亿个晶体管、16组SMM,1个SMM相当于4个SMX(控制逻辑单元),每个控制逻辑单元内置32个CUDA核心,总共2048个CUDA核心。这个数字低于发布前的预期,同时远远少于GK110的2880个,可见NVIDIA对其工作效率上的信心。
其他规格上,GM206内置了16个几何单元、128个纹理单元、64个光栅单元。而大家最关心的显存位宽上,维持在GTX680的256bit。从架构代号到显存位宽规格,GTX980更像是GTX680的下一代架构产品。
大家都知道,开普勒架构在性能功耗比已经做得十分出色,但是从GTX750的体验来看,Maxwell可谓百尺竿头更进一步,在28nm工艺保持不变的情况下,Maxwell如何做到GTX980的165W的超低TDP呢?
相比Kelpler,Maxwell架构的一项改进是最直观的,那就是CUDA核心的逻辑控制单元(注:Maxwell架构中一个SMM由四个SMX组成),简单来说就是将Kelpler的一个逻辑控制单元规模拆分成Maxwell架构中的四个。这样一来,原本Kelpler的一个逻辑控制单元要控制192个CUDA核心,现在Maxwell是一个逻辑控制单元控制32个CUDA核心。从上面的GK104与GM204的架构对比动态图,就直观地按到区别。
从一个单位的控制逻辑单元控制192个CUDA核心减少到32个CUDA核心,避免了Kelpler时代因控制逻辑单元太少以至造成CUDA冗余的情况,让CUDA的工作效率更加高,将CUDA核心充分调动起来,有助多任务下效率的提升。根据NVIDIA的官方说法,就是Maxwell每一个CUDA核心所贡献的性能是之前开普勒135%,也就是说提升了35%,那每一瓦这样的功耗所提供的性能,是之前开普勒的两倍。
众所周知,20nm的产能都被苹果占用了,所以Maxwell架构依然维持在28nm的制程。但是目前28nm制程已经十分成熟,功耗发热控制在Kelpler时代已经得到应验,产能与工艺不再成为绊脚石,通过Maxwell架构的改进、设计的优化,GM204的TDP得到了进一步降低,GTX980仅有165W,在高端显卡中绝无仅有,这点值得一赞。
附加阅读3:Maxwell带来的新技术——DX12、MFAA、DSR
支持DirectX 12
Maxwell对DX12支持无压力
2014年3月,微软发布了最新的DirectX 12。与往年的只有新显卡才能支持新DX不同,这次大多数DX11的显卡都能提供DX12的支持。这样一来,最新的Maxwell架构GM204对DirectX 12也是无压力了。
DX12本质上是DX11的进一步优化,包括CPU占用
为什么会这样呢?因为DirectX 12与以往旧版本的Direct不同,DX12没有带来更新的图形渲染技术,所以DX11显卡大松一口气。而它的重点在于改善了对底层硬件的优化,减少了CPU的负担,之前的DX11对多线程已经支持的很好,而DX12则会更上一层楼。所以,本质上DX12是DX11的改良版。
MFAA抗锯齿技术
这次Maxwell架构的推出,NVIDIA还为大家带来了新的抗锯齿技术——MFAA。
MFAA是一个动态的采样
通俗来讲,MFAA就是一个多帧数动态采样的抗锯齿技术。如上图,在第n-1帧的画面中进行采样,然后在第n帧的画面进行采样,将两个帧的画面进行临时过滤处理,再进行4倍放大,形成更细腻的画面。
对比我们常用的MSAA,就是在静态帧数上进行多重采样抗锯齿,4MSAA就是四倍放大采样然后进行边缘处理。
MFAA的采样是动态变化的,让动态画面的过渡更平滑
在静态的画面中看不出MFAA与MSAA的区别,但是在动态的画面上就不同了
这样一来,我们就了解到MFAA就是在MSAA基础上的动态化。小编的看法是,MFAA为提供灵活的边缘放大处理方式,将多个帧的画面综合抗锯齿处理并过滤到一个帧中,有助降低动态游戏画面在帧数变换时的损失,每一帧画面的变化不再给人生硬的感觉,使得3D游戏中开了抗锯齿后显得比MSAA更加真实。当然,这种处理会出现一帧的延迟,所以最好在超高帧数的基础上进行抗锯齿。
DSR
Maxwell架构另一项值得留意的新技术,就是DSR。
DSR,全称Dynamic Super Resolution,意思是动态高分辨率技术,意在在1080p分辨率中获得4K分辨率的画质感受。
官方对DSR技术的解释
1080p模拟4k分辨率?听起来很有趣,毕竟像素点数目差那么多,怎么可能实现4k画质呢?
DSR技术原理
通过DSR的技术原理,我们发现这个是通过多倍放大技术来实现的。我们知道分辨率越低,那么一个像素要显示的东西越多,可以看到的细节就会越少。所以DSR技术就是在显卡渲染层面上进行像素的放大,然后再一个像素分成多个“小像素”进行独立处理,在输出到一个显示器的像素上,让像素间的色差降低,以实现细腻的效果,从而实现模拟4K的画质。
为此,小编还制作了一张动态图,让大家观察开关DSR前后的画质区别。
目前在Geforce Experience中已经提供这种功能,如果游戏支持DSR技术,那么就会自动开启,感兴趣的玩家可以自行感受下是否真的那么神奇。
附加阅读4:Maxwell带来的新技术——VR DIRECT、VXGI
VR DIRECT是NVIDIA最新的一项降低游戏显示延迟的技术,提高画面的流畅性,这项技术是基于硬件控制的层面来进行优化的。
我们都知道,游戏画面处理好后,再显示到屏幕上,是有一定时间的,但是都是用微秒作为单位,所以我么基本上擦觉不到这个延时。标准的显示延时是50毫秒,除去显示器、游戏软件自身的固定因素,我们可以从操作系统(也就是驱动)以及GPU上进行优化,那就是VR DIRECT技术了。
MFAA画面的处理速度更快
VR DIRECT主要通过提升GPU速度,以及操作系统下的显卡驱动程序的优化来进行。通过MFAA画质下的渲染可以看到,通过驱动的优化,将画面的渲染从静止渲染转变成MFAA模式下的动态抗锯齿显示,从而降低了画面变换的所需时间,从提降低延时。
异步扭曲
同时,VR DIRECT还支持异步扭曲画面处理的技术,只能识别帧数画面之间的规律来提高画面变换的速度,从而降低延时。从上图可看到,在这项功能下凹,画面显示的延时降低了整整一半。
VR DIRECT效果还得靠游戏的支持,如EVE
由于这是动态处理技术,所以在静态的截图中我们是看不到VR DIRECT的效果的,所以还是交给GTX980/970的玩家们体验体验吧。
VXGI
DirectX 11给3D游戏带来了曲面细分,让画面效果更加立体化。而这次Maxwell架构的推出,NVIDIA为我们带来了一项崭新的画面处理技术:Voxel-Based Global Illumination,全3D全局照明技术,下称VXGI。
VXGI是基于现在已经存在的Global Illumination技术,GI技术可以处理焦散以外的全部间接照明效果,如上图的光束照到地面后的各种发散效果。所有传播(包括反射和折射)出来的光子,当它们再次与表面发生碰撞时,碰撞点都会被记录到GI的分布图中。
不过目前的GI技术是2D化的,而这次NVIDIA,将其定位三维的环境。即使不懂它的原理,但是从实际华丽的效果来看,这种VXGI技术对GPU的运算与渲染要求是相当高的,所以当性能不再成为VXGI的瓶颈的时候,才开始上位。
那么,VXGI是怎样工作的呢?就有了上面的三部曲。
首先,对3D模型的原始网格线进行分析,然后计算出3D模型中不透明的部分,综合运算结果,将图形进行放大化,为下一步的渲染做准备。
第二步,进行光束射入的时候反射分析,通过不透明度的运算,从而计算出一个反射光的渲染方式。由于每个像素的反射情况不同,加上每帧数的动态效果都不尽相同,自然这个运算量是庞大的。
第三步,最后的追踪成像,将圆柱体分割成每一个可视的表面,然后进行网格化,根据光线的反射规律来堆积光照与透明效果,然后根据3D引擎进行渲染。
上图就是支持VXGI与不支持VXGI的效果对比。观察上图第三个效果,在精细VXGI处理后的反射表面,显得十分的真实。而粗略VXGI处理的已经有一定的光照效果,但是透明效果缺失,而且光照效果略感生硬。而没有进行VXGI处理的,就犹如一张画纸,没有任何立体感。
NVIDIA官方Demo就给出了VXGI处理前后的效果对比。如果说DX11的细分曲面是为了真实的3D建模而衍生的话,那么VXGI就是为营造细腻真实的画质而生,3D画面的细节都显得十分的真实。由此我们相信,VXGI是迈向虚拟现实的又一个成果。
NVIDIA GTX980公版开箱欣赏
小编有话说:这次GTX980的公版包装可谓新意十足,上下开启的方式很少见(小编差点把卡摔地上了)。外包装上更是毫不隐讳的直接写“THE WORLD'S MOST ADVANCED GPU"——“全球最先进的GPU”,本来小编害怕NVIDIA会不小心闪了舌头,评测后发现这个口号真的是实至名归。有被毒到的小伙伴赶紧去攒银子吧~
影驰GTX980/970新品赏析
影驰GTX970黑将
影驰GTX980/970 Gamer系列外观赏析
七彩虹iGame GTX970烈焰战神U外观赏析
映众 GTX970 游戏至尊版外观赏析
技嘉GV-N980G1 GAMING-4GD外观赏析
索泰GTX970霹雳版HA
耕升GTX970 赵云版外观赏析
?
技嘉GV-N970G1 GAMING-4GD外观赏析
映众GTX980冰龙版