北京时间8月21日凌晨,NVIDIA创始人兼CEO黄仁勋在德国科隆亲自揭晓了下一代游戏显卡GeForce RTX 20系列,革命性地引入了光线追踪技术,号称自2006年引入CUDA统一着色核心以来最大的革命。
从第一颗GPU GeForce 256诞生至今已经整整19年了,GPU技术和性能一直保持着飞速发展,远远超过摩尔定律曲线,但是在图形渲染技术上几乎一直没有改变,始终都是光栅化渲染,通过计算三角形和多边形来获得画面输出,但这种技术的天然缺陷使得它只能尽可能模拟真实世界,而不可能无限逼近乃至完全复制。
光线追踪(Ray Tracing)技术则堪称图形界的“圣杯”,简单地说就是在图形渲染过程中实时跟踪物体和环境的光线,准确进行光线反射和折射、全局照明、物理阴影的绘制,可以带来近乎百分之百真实的渲染画面,尤其是光影效果。
光线追踪技术其实并不新鲜,很早就提出了,但是它的计算量太过庞大(想想要实时计算场景中无数光线每时每刻的各种传播),以前的GPU根本无力承担实时计算,直到现在,NVIDIA带来了革命性的“Turing”图灵架构,首次支持光线追踪,并加入AI人工智能,API方面则支持最新的DX12 DXR(DirectX Ray-tracing)。
图灵大核心(TU102)集成了186亿个晶体管,核心面积达754平方毫米,相比Pascal帕斯卡架构核心分别增加了60%、58%,是有史以来第二大的芯片。
它的内部有三种不同核心,一是传统的SIM CUDA核心阵列,浮点计算性能最大14TFlops,整数计算最大性能14TIPS,并支持浮点、整数并行执行,可变速率着色(Variable Rate Shading)。
二是光线追踪专用核心RT Core,每秒钟可计算最多100亿条光线(10 Giga Rays/sec),三是深度计算辅助核心Tensor Core,FP16浮点性能110TFlops,INT8整数性能220TOPS,INT4整数性能440TOPS。
因为是全新技术,缺乏统一的衡量指标,NVIDIA也发明了不少新的计算方法,比如78T RTX-OPS,代表图灵架构执行的光线追踪操作数量。
RTX光线追踪渲染技术其实在今年3月份的GTC技术大会上就提出了,之前使用四块Volta伏特架构的Tesla V100计算卡才能得到满意的效果,而现在只需一颗Turing核心就能获得更好的性能,Pascal架构更是没法比。
下边来几张光线追踪开关效果图对比,其中开启后的效果图灵架构都可以实时完成:
游戏对于图灵架构光线追踪的支持需要特别优化,但是凭借完善的生态系统和强大的号召力,已经得到了众多大作的支持,首发就有20多款,包括即将发布的《战地5》(Battlefield V)、《古墓丽影:暗影》(The Shadow of Tomb Raider)、《地铁:离去》(Metro Exodus)等等,包括国产的《逆水寒》、《剑侠情缘3》。
好了下边来看产品:
NVIDIA本次首发一口气推出了三款新卡,均采用开放式双风扇设计。
最顶级的是RTX 2080 Ti,4352个CUDA核心,核心基准频率1350MHz,加速频率公版1545MHz、FE公版超频1635MHz,搭配352-bit 11GB GDDR6显存,等效频率14GHz,带宽616GB/s,整卡功耗260W,8+8针供电,光线追踪性能10 Giga Rays/s、78T RTX-OPS。
接下来是RTX 2080,2944个CUDA核心,核心基准频率1515MHz,加速频率公版1710MHz、FE公版超频1800MHz,搭配256-bit 8GB GDDR6显存,等效频率14GHz,带宽448GB/s,整卡功耗225W,8+6针供电,光线追踪性能8 Giga Rays/s、60T RTX-OPS。
最后是RTX 2070,2304个CUDA核心,核心基准频率1410MHz,加速频率公版1410MHz、FE公版超频1710MHz,搭配256-bit 8GB GDDR6显存,等效频率14GHz,带宽448GB/s,整卡功耗175W,8针供电,光线追踪性能6 Giga Rays/s、45T RTX-OPS。
RTX 2080 Ti 999美元,国行9999元人民币;RTX 2080 699美元,国行6499元人民币,即日起开始预售,9月20日正式上市。
RTX 2070 499美元,国行价格未公布,估计在4999元左右。
另外还有个专业级的双卡组合Quadro RTX 8000 (DUAL),配备96GB GDDR6显存,光线追踪性能20 Giga Rays/s、188T RTX-OPS,20000美元。
延伸阅读: