老黄挤爆牙膏!Ada Lovelace显卡性能值得期待

大千世界 132 0

  在时隔两年之后,NVIDIA终于推出Ada Lovelace架构显卡,首款产品GeForce RTX 4090将于10月12日正式上市。RTX 4080 16GB/12GB也将于11月上市。

  与Ampere使用三兴8nm工艺相比,Ada Lovelace架构的制造工艺终于不再“拖后腿”,台积电工艺带来巨大的能效提升,同时也让显卡频率更高。

  凭借更多的CUDA和更高的频率,GeForce RTX 4090(82.6TFlops)理论传统性能(FP32)是RTX 3090 Ti(约40 TFlops)的两倍。

  就算16GB版RTX 4080(48.7 TFlops)还是比RTX 3090 Ti高23.5%左右,对比RTX 3080 Ti(34 TFlops)高40%。

  有趣的是,12GB版RTX 4080(40 TFlops)的理论传统性能与RTX 3090 Ti相同,意味着Ada Lovelace首发的三款产品,理论性能至少达到上一代旗舰产品的水平,旗舰产品的对比甚至实现翻番。

  虽然FP32无法直接提现到游戏、专业加速软件中,但NVIDIA至少实现了在发布会上性能翻番的目标。

  在Ada Lovelace的缓存系统存在极大的差异。老黄在发布会上只字未提3D封装的缓存,意味着这一代GPU以然是传统设计方案。

  不过没有3D缓存系统并非不可理解,隔壁AMD在锐龙7 5800X3D(105W热设计功耗)上的选择就可以看到,3D封装必然要牺牲一定的散热性能。考虑到首款三款显卡(285W-450W)都是发热大户,使用3D封装带来的性能提升,或许不远不如提升散热性能重要。

  在显存上,三款显卡更是体现出巨大的差异,这些差异未来将会体现到全系列的产品线上。

  不同核心将会直接决定GPU的显存位宽,AD102最高384-bit位宽,未来不排除RTX 3080 Ti/Super会使用AD102核心。

  同时将显存位宽削减至320-bit。AD103核心最高显存位宽定在256-bit,除了某些缺陷特别严重的核心需要屏蔽更多单元外。

  至于AD104核心,它的最高显存位宽为192-bit,对应RTX 4070系列显卡(12GB版RTX 4080大概率是原RTX 4070)。

  

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待-第1张图片-大千世界


  在具体的显存上,采用AD102核心的GeForce RTX 4090使用与上一代相同的384-bit位宽和21Gbps的GDDR6x显存,显存带宽与RTX 3090 Ti相同的1008GB/s,但至少没有开“倒车”。

  至于为何没有使用RTX 4080 16GB的23Gbps显存,笔者猜测有两种可能,第一是显存产能较低,无法满足NVIDIA的需求。第二就是考虑到显卡的供电和散热需求,无法搭载发热更高的23Gbps显存。

  与AD102核心不同,使用AD103核心的GeForce RTX 4080 16GB在显存带宽上就开了“倒车”,主要原因还是显存位宽从上一代RTX 3080的320-bit看到256-bit。

  虽然显存频率从19Gbps提升到23Gbps,但带宽依然从760GB/s降低至736GB/s。只是,未来不排除NVIDIA会推出256-bit位宽的RTX 4070 Ti/Super。

  最后是使用AD104核心的RTX 4080 12GB,在192-bit位宽和21Gbps显存下,其显存带宽仅有504GB/s,比RTX 3070高12.5%,大幅落后RTX 3070 Ti的604GB/s。

  如果说RTX 4080 16GB保住80级别定位的话,那RTX 4080 12GB就是拿来凑数的,更准确的命名应该是RTX 4070。

  

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待-第2张图片-大千世界


  

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待-第3张图片-大千世界


  用户最关心的性能方面,NVIDIA官方提供部分游戏的性能预览。从给出的数据来看,RTX 4090相对于RTX 3090 Ti,微软的飞行模拟提升将近一倍。

  赛博朋克更是超过4倍。至于为何提升幅度如此之大,应该是NVIDIA精选游戏有关。两款RTX 4080对比的是RTX 3080 Ti,提升幅度在1.5倍到3倍之间。

  事实上,NVIDIA在Ada Lovelace上堆料,Tensor Core从上一代的320个提升至1400个,并加入从Hopper上下放的各种Transformer Engine引擎,能够带来更好的加速训练效果。最重要的DLSS 3,基于光流的补帧设计可以带来更高的理论帧率。

  在功耗不变的情况下,NVIDIA采用比8nm先进两代的4nm工艺,能耗比的提升应该会远超想象。

  最直观的对比,就是从Maxwell(GTX 980 Ti)到Pascal(GTX 1080 Ti),两者的热设计功耗都是250W,但实际游戏性能提升超过60%,这就是Ada Lovelace的游戏表现值得期待的原因。

  写在最后:

  从目前公开的数据来看,NVIDIA Ada Lovelace的性能提升是非常值得期待。NVIDIA精选了部分对自家显卡优化更到位的游戏来展示性能提升,虽然实际游戏提升不如宣传,是同样值得期待。

  另外,NVIDIA两款RTX 4080显卡更像为清空RTX 30系列显卡做出来的产品,两款显卡明显有“智商税”的嫌疑。笔者认为NVIDIA不会大量出货这两款RTX 4080,在完成30系显卡清仓后更新产品线,带来更具性价比的产品,以满足用户的使用需求。

  

老黄挤爆牙膏!Ada Lovelace显卡性能值得期待-第4张图片-大千世界


标签: Ada Lovelace 显卡

抱歉,评论功能暂时关闭!