老黄挤爆牙膏！Ada Lovelace显卡性能值得期待

大千世界 2022年09月23日 22:24 162 0

　　在时隔两年之后，NVIDIA终于推出Ada Lovelace架构显卡，首款产品GeForce RTX 4090将于10月12日正式上市。RTX 4080 16GB/12GB也将于11月上市。

　　与Ampere使用三兴8nm工艺相比，Ada Lovelace架构的制造工艺终于不再“拖后腿”，台积电工艺带来巨大的能效提升，同时也让显卡频率更高。

　　凭借更多的CUDA和更高的频率，GeForce RTX 4090(82.6TFlops)理论传统性能(FP32)是RTX 3090 Ti(约40 TFlops)的两倍。

　　就算16GB版RTX 4080(48.7 TFlops)还是比RTX 3090 Ti高23.5%左右，对比RTX 3080 Ti(34 TFlops)高40%。

　　有趣的是，12GB版RTX 4080(40 TFlops)的理论传统性能与RTX 3090 Ti相同，意味着Ada Lovelace首发的三款产品，理论性能至少达到上一代旗舰产品的水平，旗舰产品的对比甚至实现翻番。

　　虽然FP32无法直接提现到游戏、专业加速软件中，但NVIDIA至少实现了在发布会上性能翻番的目标。

　　在Ada Lovelace的缓存系统存在极大的差异。老黄在发布会上只字未提3D封装的缓存，意味着这一代GPU以然是传统设计方案。

　　不过没有3D缓存系统并非不可理解，隔壁AMD在锐龙7 5800X3D(105W热设计功耗)上的选择就可以看到，3D封装必然要牺牲一定的散热性能。考虑到首款三款显卡(285W-450W)都是发热大户，使用3D封装带来的性能提升，或许不远不如提升散热性能重要。

　　在显存上，三款显卡更是体现出巨大的差异，这些差异未来将会体现到全系列的产品线上。

　　不同核心将会直接决定GPU的显存位宽，AD102最高384-bit位宽，未来不排除RTX 3080 Ti/Super会使用AD102核心。

　　同时将显存位宽削减至320-bit。AD103核心最高显存位宽定在256-bit，除了某些缺陷特别严重的核心需要屏蔽更多单元外。

　　至于AD104核心，它的最高显存位宽为192-bit，对应RTX 4070系列显卡(12GB版RTX 4080大概率是原RTX 4070)。

　　在具体的显存上，采用AD102核心的GeForce RTX 4090使用与上一代相同的384-bit位宽和21Gbps的GDDR6x显存，显存带宽与RTX 3090 Ti相同的1008GB/s，但至少没有开“倒车”。

　　至于为何没有使用RTX 4080 16GB的23Gbps显存，笔者猜测有两种可能，第一是显存产能较低，无法满足NVIDIA的需求。第二就是考虑到显卡的供电和散热需求，无法搭载发热更高的23Gbps显存。

　　与AD102核心不同，使用AD103核心的GeForce RTX 4080 16GB在显存带宽上就开了“倒车”，主要原因还是显存位宽从上一代RTX 3080的320-bit看到256-bit。

　　虽然显存频率从19Gbps提升到23Gbps，但带宽依然从760GB/s降低至736GB/s。只是，未来不排除NVIDIA会推出256-bit位宽的RTX 4070 Ti/Super。

　　最后是使用AD104核心的RTX 4080 12GB，在192-bit位宽和21Gbps显存下，其显存带宽仅有504GB/s，比RTX 3070高12.5%，大幅落后RTX 3070 Ti的604GB/s。

　　如果说RTX 4080 16GB保住80级别定位的话，那RTX 4080 12GB就是拿来凑数的，更准确的命名应该是RTX 4070。

　　用户最关心的性能方面，NVIDIA官方提供部分游戏的性能预览。从给出的数据来看，RTX 4090相对于RTX 3090 Ti，微软的飞行模拟提升将近一倍。

　　赛博朋克更是超过4倍。至于为何提升幅度如此之大，应该是NVIDIA精选游戏有关。两款RTX 4080对比的是RTX 3080 Ti，提升幅度在1.5倍到3倍之间。

　　事实上，NVIDIA在Ada Lovelace上堆料，Tensor Core从上一代的320个提升至1400个，并加入从Hopper上下放的各种Transformer Engine引擎，能够带来更好的加速训练效果。最重要的DLSS 3，基于光流的补帧设计可以带来更高的理论帧率。

　　在功耗不变的情况下，NVIDIA采用比8nm先进两代的4nm工艺，能耗比的提升应该会远超想象。

　　最直观的对比，就是从Maxwell(GTX 980 Ti)到Pascal(GTX 1080 Ti)，两者的热设计功耗都是250W，但实际游戏性能提升超过60%，这就是Ada Lovelace的游戏表现值得期待的原因。

　　写在最后：

　　从目前公开的数据来看，NVIDIA Ada Lovelace的性能提升是非常值得期待。NVIDIA精选了部分对自家显卡优化更到位的游戏来展示性能提升，虽然实际游戏提升不如宣传，是同样值得期待。

　　另外，NVIDIA两款RTX 4080显卡更像为清空RTX 30系列显卡做出来的产品，两款显卡明显有“智商税”的嫌疑。笔者认为NVIDIA不会大量出货这两款RTX 4080，在完成30系显卡清仓后更新产品线，带来更具性价比的产品，以满足用户的使用需求。

本文地址： https://www.dqsj.net/keji/85163.html

文章来源： IT之家