5月14日晚,在GTC 2020线上发布会上,NVIDIA干脆利落地在几分钟内就放出了老黄的演讲视频,正式推出了安培(Ampere)架构GPU,7nm工艺,540亿晶体管,20倍AI算力,5大技术创新,总之新核弹来了。
目前NVIDIA还没有正式公开安培GPU的详细架构细节,但是跟上次的图灵GPU一样,黄仁勋表示这是NVIDIA八代GPU史上最大的一次性能飞跃。
首款基于安培GPU的产品是Tesla A100加速卡,根据NVIDIA所说,它带来了5大技术创新:
1、 全新安培GPU架构,540亿晶体管,世界上最大的7nm处理器。
2、 第三代Tensor Core AI核心,支持TF32运算,无需任何代码改变就可以让AI性能提升20倍,还支持FP64双精度运算,与HPC应用相比带来了2.5倍的性能。
3、 Multi-instance GPU多实例GPU:简称MIG,这是一项创新技术,可以将一个GPU划分为七个独立的GPU,针对不同的目标提供不同的运算,最大化提高计算效率。
4、 NVLink 3.0:新一代GPU总线的性能翻倍,可以在服务器应用中提供更有效的性能扩展。
5、 结构稀疏性:这项新技术利用了AI运算中固有的稀疏性实现了性能翻倍。
这5大技术创新使得Tesla A100加速卡成为苛刻工作负载的理想选择,不仅可以用于AI推理、AI训练,还可以用于科学仿真、AI对话、基因组、高性能数据分析、地震建模及财务计算等等。
与此同时,NVIDIA还宣布了基于Tesla A100的DGX A100超算,有8路Tesla A100加速卡,性能高达5PFLOPS,阿里云、AWS云、谷歌云、微软Azure、甲骨文及腾讯云都将推出基于DGX A100的云服务。
目前DGX A100发布之后就立即上市了,跟当年的Tesla V100完全不同,美国、德国的多个实验室及超算中心已经开始使用Tesla A100作为超算解决方案了。
PS:今晚的视频中,老黄的头发已经白了一半,作为目前全球最强GPU的掌门人,7nm安培GPU显然花费了NV公司不少心血,目前揭开的还只是计算方面的,RTX游戏卡还没公布多少信息。
延伸阅读:
7nm安培GPU详解:400W功耗、40GB HBM2、826mm2怪兽出炉
Tesla A100果然割了一刀 7nm安培完整版128组SMX单元:再强20%