4K光追轻松拿捏映众RTX 4070 Ti SUPER曜夜显卡评测

2024.04.27

北京时间1月23日晚10点，NVIDIA正式解禁了RTX 40 SUPER系列台式机显卡的第二款型号——RTX 4070 Ti SUPER，其产品定位介于RTX 4070 Ti和RTX 4080之间。

先说一个好消息，RTX 4070 Ti SUPER的起售价为6499元，这个定价跟RTX 4070 Ti一样。在核心规格、显存规格都要高于RTX 4070 Ti的情况下，全新的RTX 4070 Ti SUPER可谓加量不加价!

    一周前上市的RTX 4070 SUPER已给人们带来了不小的惊喜，现在对于全新RTX 4070 Ti SUPER，它的表现又会如何?此次评测笔者便利用映众RTX 4070 Ti SUPER曜夜这款新显卡，为大家揭晓答案。
    Ada Lovelace架构与全新的RTX 4070 Ti SUPER
    RTX 4070 Ti SUPER基于英伟达Ada Lovelace架构设计。为了让大家更好地了解到这款新显卡，笔者首先会对Ada Lovelace架构以及所支持的一些重要技术进行介绍。
    (一) RTX 40 SUPER系列台式机显卡第2弹——RTX 4070 Ti SUPER

    RTX 4070 Ti SUPER基于AD103-275显示核心设计，拥有8448个CUDA核心，搭配16GB容量、256bit位宽的GDDR6X显存。
    而之前的RTX 4070 Ti基于AD104-400显示核心设计，拥有7680个CUDA核心，搭配12GB容量、192bit位宽的GDDR6X显存。
    对比CUDA核心数量，全新的RTX 4070 Ti SUPER相比RTX 4070 Ti有着10%的规格提升。
    更高端的RTX 4080基于AD103-300显示核心设计，拥有9728个CUDA核心，搭配16GB容量、256bit位宽的GDDR6X显存。
    从硬件规格来看，RTX 4070 Ti SUPER明显要高于RTX 4070 Ti。而跟更高端的RTX4080相比，还是有一定差距的。

    (映众RTX 4070 Ti SUPER曜夜显卡的GPU-Z信息)
    本文选用的映众RTX 4070 Ti SUPER曜夜显卡与RTX 4070 Ti SUPER创始人版保持一致，其GPU频率为2340MHz，Boost频率为2610MHz，显存频率为1313MHz(等效21000MHz)。
    (二) Ada Lovelace架构核心

(Ada Lovelace架构核心)

    (Ada Lovelace架构核心GPC单元)
    Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。根据NVIDIA官方的介绍，Ada Lovelace架构核心所采用的第3代RT Core不仅将光线与三角形求交性能提高了一倍，还将RT-TFLOP峰值性能提高了一倍之多。第3代RT Core还配备了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎，进一步提升了光追计算的性能以及减少计算开销，带来了更好的光线追踪效果表现。Ada Lovelace架构核心配备的第四代Tensor Core引入了来自专业级H100数据中心GPU的FP8 Transformer引擎带来了更加强悍的AI算力。

    (第三代RT Core结构示意图，相比前代，增加了2个功能)
    Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER着色器执行重排序)技术来更好的对于着色器的工作进行调度排序，在使用上可以根据不同的负载需求来执行渲染，可对负载较为统一的画面进行渲染，降低工作开销。根据英伟达官方的介绍，这一个SER功能将作为API开放给开发者使用。英伟达官方宣称，SER功能的加入至高可带来两倍RT Core性能上的改善，对于光追游戏来说更可带来体验的升级。根据NVIDIA官方的数据，全新的SM(流式单元处理器)可带来至高两倍的性能以及能效升级，这一项升级不可谓不小。

    (Ada Lovelace架构核心SM结构图)
    Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)的升级以外，带来了全新的第八代NVENC硬件编码器，这一全新的第八代NVENC硬件编码器整合了对AV1视频编码格式的支持，可以在传统的H.264等格式之外，加入了对AV1这一主流新标准的支持，可以进行对于AV1格式的编码与解码，有效提升了生产力方面的表现，对于创作型用户、游戏主播等群体来说更是如虎添翼。来自NVIDIA官方的数据显示，第八代NVENC硬件编码器在AV1的效率上比H.264编码器的效率提高了40%，这一提升非常明显。

    而除了核心上的升级以外，Ada Lovelace架构核心还大幅度提升了其L2缓存。其中RTX 4070 Ti SUPER显卡所采用的AD103-275显示核心拥有48MB的L2缓存，L2缓存容量相比上一代RTX 3090 Ti显卡(6MB L2缓存)可谓提升巨大。大容量的L2缓存带来了数据命中率的有效提升，在现阶段显存带宽提升有效的情况下，通过升级更大容量的L2缓存，可以进一步提升数据命中表现，带来性能方面的升级，根据NVIDIA官方的说法，大容量L2缓存的加入为GPU的一系列操作到带来了更高的收益，尤其是在光线追踪等场景下，表现更为明显。
    (三) DLSS 3与NVIDIA Reflex
    Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升。

DLSS 3包含有DLSS 2(DLSS超分辨率技术)，以及全新加入的DLSS帧生成技术，这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力。在一项技术在运行过程中，其通过光流处理器所得到的一系列数据后，以光流加速技术(Optical Flow Acceleration，简称为OFA)来生成画面信息，而AI算力则负责来对画面进行进一步的优化，从而在游戏中加入了更多的帧画面，进行帧数的提升。

DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧，相当于使用1/8的算力，就完成了整个计算过程，而通过这一个流程的循环，可在提升帧数的同时节省资源开销，进一步带来更好游戏体验。

    而在DLSS 3的帧生成技术上，由于可能带来延迟的增加，因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法，DLSS 3通过整合NVIDIA Reflex以及一系列的技术，可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
    目前DLSS 3版本已更新至DLSS 3.5。DLSS 3.5特别新增光线重建(Ray Reconstruction，简称RR)，主要是解决目前光追游戏中人工设计的降噪器所带来的画面质量问题。

    在DLSS 3.5出现之前，降噪器的调整主要是交给游戏开发者来做的，也就是前文所说的人工设计的降噪器。降噪器会用前几帧的图像，以及混合邻近的像素去达成填充画面的目的。不过即便图像是完整的，但是仍有一些缺陷，比如说多帧结合产生的鬼影，还有画面细节上的缺失。为了得到较好的结果，一般多个降噪器会同时运行，这也对帧率造成了影响。而DLSS 3.5中的光线重建是人工设计降噪器的替代品。NVIDIA为其投入了DLSS 3的5倍训练数据量，因此它能识别出不同的光线追踪效果，从而准确处理图像中的每个像素。
    映众RTX 4070 Ti SUPER曜夜显卡欣赏

    在外观设计上，映众RTX 4070 Ti SUPER曜夜与笔者一周前评测过的映众RTX 4070 SUPER曜夜大体一致，还是熟悉的样子。
    映众RTX 4070 Ti SUPER曜夜显卡以黑、灰色为主色调，主打轻薄双槽特色。该显卡没有设计RGB灯效，也没有什么花哨的设计，低调不张扬。
    由于采用的是双风扇散热设计，这款显卡的尺寸比较短，实测约25cm。加上标准双槽厚度设计，令这款显卡的安装兼容性很不错。

显卡背面设计了金属背板，上面有一些镂空设计，以便兼顾散热效果。

显卡输出接口为三个DP 1.4以及一个HDMI 2.1。

散热器顶部上面印有“INNO3D GEFORCE RTX”的字样。

    显卡辅助供电接口为12VHPWR接口。
    下面将散热器拆卸下来，露出显卡PCB，继续欣赏一下它的用料。

这款显卡虽然长度为25cm，但是它的PCB并不长。通过对比明显能够看出散热器和背板比PCB长出很多。

映众RTX 4070 Ti SUPER曜夜显卡的供电设计基于RTX 4070 Ti SUPER创始人版方案。GPU左右共设计了13相供电，搭配电容铁素体电感、固态电容等高品质元器件，用料值得信赖。

全新的AD103-275显示核心，芯片面积为378.6平方毫米，尺寸不算大。

    显存是来自美光的GDDR6X，单颗2GB容量。这款显卡PCB正面共设计有8颗显存，组建了16GB显存容量。
    RTX 4070 Ti SUPER也是RTX 40系列台式机显卡当中第四款显存容量大于等于16GB的型号。

这款显卡采用的是HERCULEZ X2散热器，搭配有两枚直径约9cm散热风扇。风扇支持可拆洗，便于用户们日常保养清灰。此外，这款散热器支持智能风扇停转功能，在待机状态下或者轻负载状态下，它的这2枚风扇会全部停转，以便实现安静的运行效果。

    这款散热器的金属主体部分比较大，纯铜镀镍底座，5根纯铜镀镍热管，加上大面积散热鳍片矩阵，不仅能够为GPU进行散热，而且还能够为显存、电感以及MOS管进行散热。
    测试平台介绍

    笔者组建了一套性能出色酷睿i9-14900K测试平台，用来测试显卡性能。为了对比映众RTX 4070 Ti SUPER曜夜的性能，笔者此次测试还加入RTX 4070 Ti以及RTX 4080的成绩。
    此次测试所选用的这款RTX 4070 Ti是一款非公版显卡，其GPU频率为2310MHz，Boost频率为2670MHz，显存频率为1313MHz(等效21000MHz)。
    此次测试所选用的这款RTX 4080同样是一款非公版显卡，其GPU频率为2205MHz，Boost频率为2565MHz，显存频率为1400MHz(等效22400MHz)。
    英特尔酷睿14代处理器搭配RTX 40系列显卡是支持Resizable BAR技术的。为了充分发挥比映众RTX 4070 Ti SUPER曜夜的性能表现，以下测试环节均是在Resizable BAR开启状态下进行的。
    游戏性能测试
    (一) 3DMark基准测试
    首先是映众RTX 4070 Ti SUPER曜夜在3DMark基准测试当中的表现。性能到底有多强，大家一看便知。

    在3DMark Time Spy测试项目中，映众RTX 4070 Ti SUPER曜夜的性能约为RTX 4070 Ti的106%。
    在3DMark Port Royal光线追踪测试项目中，映众RTX 4070 Ti SUPER曜夜的性能约为RTX 4070 Ti的111%。
    显而易见，映众RTX 4070 Ti SUPER曜夜的游戏性能明显要好于RTX 4070 Ti。但是跟更高端的RTX 4080相比，性能还是存在较大差距的。
    (二) DLSS 3游戏实测
    目前已有《赛博朋克2077》、《瘟疫传说：安魂曲》、《光明记忆：无线》、《生死轮回》等热门游戏大作支持DLSS 3技术。此次DLSS 3游戏实测，笔者将利用3款游戏进行测试。
    DLSS 3游戏测试版——《赛博朋克2077》

DLSS 3游戏——《瘟疫传说：安魂曲》

DLSS 3游戏——《极限竞速：地平线5》

    通过上述3款DLSS 3游戏来看，DLSS 3技术为RTX 40系列显卡带来的游戏帧数提升是巨大的。借助DLSS 3技术，在4K分辨率下，映众RTX 4070 Ti SUPER曜夜已能够畅玩大量新时代光追游戏，实现4K 100帧的优秀表现。
    (三) 其它游戏实测
    接下来，笔者再测试一些非DLSS 3游戏。
    游戏实测——《中土世界：暗影之战》

游戏实测——《战争机器5》

游戏实测——《幽灵行动：荒野》

游戏实测——《古墓丽影：暗影》

游戏实测——《地铁：离去》增强版

    非DLSS 3游戏中，映众RTX 4070 Ti SUPER曜夜的性能表现依然很好，大部分游戏4K 100帧轻松实现。
    生产力性能测试
    (一) AV1硬件加速编解码测试
    为什么AV1编解码技术越来越受欢迎?理由很简单，采用AV1编解码的视频能够以更低的码率，实现其它主流编解码视频相同的画质。说白了，在视频画质相同的情况下，采用AV1编解码的视频文件体积会更小，以至于能够为视频创作者们节省大量的硬盘空间。

目前剪映、万兴喵影、达芬奇等视频软件已可支持AV1硬件加速编/解码功能。接下来笔者利用剪映这款软件，将一部H264编码的MP4视频，导出为一部AV1编码的MP4视频。

    显而易见，在RTX 40系列显卡AV1视频编码加速的助力之下，转换时间比单用处理器转换大幅缩短，加速效果相当显著。
    (二) DLSS 3.5渲染测试——D5渲染器

目前国产渲染器——D5渲染器已更新DLSS 3.5预览支持，可以让用户在复杂渲染模型的预览场景中获得更为流畅的使用反馈，为用户提供更高帧率的显示。笔者此次利用映众RTX 4070 Ti SUPER曜夜进行了D5渲染器场景列车中环境非常复杂的《木构建筑》预览体验，并记录开启以及关闭DLSS 3.5进行预览的帧数变化。

    从帧数表现可见，这个渲染预览场景对于性能要求非常高，在未开启DLSS 3.5的情况下，预览帧数仅有13帧，不过在开启DLSS 3.5进行预览之后，帧数会提升到37帧。虽然还不是非常流畅，但是已拥有了接近3倍的预览视觉效果提升，DLSS 3.5的作用还是非常明显的。
    (三) AI图片生成测试
    RTX 40系列显卡的Tensor核心拥有强大的深度学习能力，可以高效完成AI绘图创作。这次测试我们使用Satble Diffusion应用运行AI程序，绘制50张1000×1000分辨率的图片，并计算每分钟生成的张数。

    结果显示，映众RTX 4070 Ti SUPER曜夜平均每分钟可生成4.7954张图片，AI绘图创作效率是比较高的，表现更加接近RTX 4080。
    散热器测试
    (注：笔者所处的室温维持在26℃)
    利用FurMark，笔者将对映众RTX 4070 Ti SUPER曜夜进行压力测试。

    通过10分钟的烤机，默认频率下满载时GPU温度稳定在约67.5℃，GPU频率稳定在约2760MHz左右，显卡满载功耗约280W左右。散热设计可靠，同时静音效果也不错，令人放心。
    此次烤机测试也印证了一个事实，这种6千元价位档的RTX 40系列高端显卡，双风扇散热设计其实已经足够了!
    总结
    加量不加价!全新RTX 4070 Ti SUPER的表现依旧带给了人们不小的惊喜，其性能表现确实要明显优于RTX 4070 Ti。当然，跟更高端的RTX4080相比，RTX 4070 Ti SUPER还是存在不小性能差距的，这一点大家也需要清楚。
    根据笔者从多家AIC厂商打听到的消息，RTX 4070 Ti SUPER上市之后，RTX 4070 Ti便会停产。因此，RTX 4070 Ti SUPER可以看作是RTX 4070 Ti的继任者，接棒6千元档显卡市场。此次加量不加价，也令NVIDIA在6千元档显卡市场上拥有了更强的产品竞争力。

作为本文的测试显卡，映众RTX 4070 Ti SUPER曜夜尺寸小巧，卡长仅25cm，并且性能表现和散热设计皆不错，特备适合用来组建高性能小尺寸机箱平台。心仪的用户可以到京东商城映众旗舰店购买，该显卡首发价就是6499元。