索泰 RTX4070 X-GAMING OC 欧泊白显卡评测
今年发布的首批 RTX4070 显卡有个非常有趣的现象,白色涂装的显卡数量大大增加,而且在涂装样式和质感细节上都很有设计感,比如我们拿到的这张索泰 RTX4070 X-GAMING OC 欧泊白。当然,号称低功耗 + 低噪音的双 Buff 也是这次 RTX4070 的最大卖点,那么接下来就借这张卡看看 RTX4070 的表现究竟如何吧。
本次测试中,我们将搭配以下硬件用作测试平台,确保测试时不会出现性能瓶颈。
外观设计
索泰 RTX4070 X-GAMING OC 欧泊白是一张两槽半的卡,三围尺寸分别是 30.3x12.1x6.1cm,这样的尺寸对于机箱的兼容性还是不错的,拿在手里也不会觉得过于厚重。
在显卡正面,外部装甲上大量运用了浅灰色的涂鸦纹理,看起来非常潮酷,但低饱和度的色调配合纯白底色,不会显得太过张扬。
风扇部分索泰 RTX4070 X-GAMING OC 欧泊白也采用了全白涂装处理,包括转座部分,所以整个显卡的视觉一体性较强。
索泰 RTX4070 X-GAMING OC 欧泊白的背板部分涂鸦元素更多,背板右侧部分的镂空区域不算大,但也能帮助散热气流吹透鳍片,增强散热效果。
显卡背板最外圈是一层白色包边,中间的 ZOTAC 字母标识支持 RGB 灯光,默认灯光为白色,一体感很强,也支持各种主流的灯光同步软件以及自定义光效调节。
侧边接口部分配备了 3*DP1.4 接口和 1*HDMI2.1 接口,最高支持 8K / 60 帧输出。供电方面,它采用了最新 ATX3.0 规范的 16Pin 供电接口,和 RTX4070Ti 保持了一致。
核心解析
RTX 4070 的核心与 RTX4070Ti 一样是基于 AD104 核心所打造的,里面有 4 组满血的 GPC,内部共有 5888 个 CUDA 核心、184个 Tensor 核心、46 个第三代 RT 核心和 64 个 ROP 单元,另外,NVENC 视频编码单元相比 4070Ti 少了一个,NVDEC 视频解码单元依旧保留。
RTX4070 的核心频率是 1920MHz,Boost 频率 2495MHz。显存方面则是 192-bit位宽的 12GB GDDR6X,显存频率高达 21000MHz。从上述定位中我们可以看出,RTX 4070 是一张定位 2K 高帧率游戏的中高端显卡。
RTX 4070 同样基于最新款的 NVIDIA Ada 架构打造,它升级到了TSMC 4N NVIDIA 定制工艺,因此实现了高达 2 倍的性能功耗比飞跃。流式多处理器的吞吐量超过上一代产品 2 倍。第三代 RT Cores 的有效光线追踪计算能力是上一代产品 2.8 倍。第四代 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的 Tensor 处理性能,超过上一代的 5 倍。SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。
反映到具象的功能上,新架构带来了不少的新功能:由于 Ada 光流加速器的引入,使得 DLSS 3 能够预测场景中帧和帧之间的运动变化,实现 AI 插帧,在保持图像质量的同时提高帧率。
理论性能
接下来我们进行理论性能测试环节,双烤 15 分钟,此时显卡核心温度稳定在 61 度,功耗 204W,讲真这个温度控制很不错,毕竟功耗给得比较高,而且没有很大的噪音,体验有点出乎意料。
接下来进行 3DMark 压力测试,这个测试可以检测连续跑分下显卡性能有没有发生下降,一般 97% 以上才算合格的显卡。索泰 RTX4070 X-GAMING OC 欧泊白最终得分 99.2%,完美通过测试。
在 3DMark TimeSpy DX12 测试中,索泰 RTX4070 X-GAMING OC 欧泊白获得了 18137 分的显卡分,相比 RTX 3080 12GB 的 18793 分略低一点点,作为对比 RTX 3090 为 20501 分,算是正常发挥。
在 3DMark Fire Strike Extreme 的测试中,索泰 RTX4070 X-GAMING OC 欧泊白的显卡分数为 21074 分,作为对比 GeForce RTX3080 12G 分数为22781 分。
而在 3DMark Portal Royal 光追测试中,索泰 RTX4070 X-GAMING OC 欧泊白获得了11123 分,RTX3080 12GB 的分数为 12157 分。不过反映到实际游戏中,差距不会太大。
游戏实测
接下来,我们就进行一下游戏实测,所有游戏我们就在 2K 分辨率最高特效下进行测试,有 DLSS 就开启平衡档 DLSS,有 DLSS3 我们则会分别测试打开关闭前后的帧数。首先是老牌 FPS 游戏《CS:GO》,索泰 RTX4070 X-GAMING OC 欧泊白达到了 480 帧,足够用高刷显示器畅玩。
值得一提的是,目前十大竞技射击游戏中已有八款支持 NVIDIA Reflex,包括《Apex 英雄》、 《使命召唤: 战区 2》、《命运 2》、《逃离塔科夫》、《堡垒之夜》、《守望先锋:归来》、《彩虹六号:围攻》和《无畏契约》,开启 NVIDIA Reflex 后可以帮助玩家在保证高画质和高帧率的同时,也能拥有最低的延迟表现,后面的评测中我会详细提到。
经典 3A 游戏我们还测了两款,在《古墓丽影:暗影》中,索泰 RTX4070 X-GAMING OC 欧泊白使用 2K 分辨率及默认最高画质运行自带基准测试,平均帧数为 174 帧,作为对比 RTX3070Ti 可以跑到 142 帧;而打开 DLSS2 质量档之后,帧数提升至 207 帧,作为对比 RTX3070Ti 为 165 帧。
还有一款神作《荒野大镖客 2:救赎》中,2K 分辨率最高画质的平均帧为 103,作为对比 RTX3070Ti 可以跑到 90 帧;开启 DLSS 质量档后,也可以达到平均 120 帧的成绩,作为对比 RTX3070Ti 可以跑到 90 帧,在 2K 下基本可以说是电竞级帧数体验了。
当然,以上这些帧数都是基于 DLSS2 基础上的,RTX40 系列最吸引人的还是 DLSS 3 技术。DLSS 3 是一款由 AI 驱动的性能倍增技术,由全新第四代 Tensor Core 和 GeForce RTX40 系列 GPU 的全新光流加速器驱动,是 NVIDIA 广受好评的深度学习超级采样技术的最新版本,并拥有开创性的光学多帧生成功能,将开启 NVIDIA RTX 神经网络渲染游戏和应用的新时代。
简单地说,过去的 DLSS 2 是通过渲染出一个低分辨率图像,然后 AI 放大至高分辨率,实现画质与帧数的提升。而全新的 DLSS 3 在兼容 DLSS 2 的基础上,还新增了帧生成功能,可以在两个真实帧之间插入 AI 推算出来的全新帧,实现帧数的倍增。再结合 DLSS 2 的超分辨率功能,AI 能重建至多八分之七的显示像素,与没有 DLSS 相比,游戏性能最高可提升4 倍!
就目前来说,首发支持 DLSS 3 的游戏已有 30 款,以后的新游戏势必也会第一时间支持 DLSS 3,并且总数还在按月为时间单位增加,如果算上所有支持 DLSS 的游戏和应用,那么这个数量就一下子来到了 280 余款。
支持 DLSS 3 的游戏我们同样选择了三款进行测试,首先是《赛博朋克:2077》,在2K 最高画质超级光追下运行它自带的基准测试,不出意外默认只有 37 帧,勉强能玩的水平。开启 DLSS 2 质量可以到 67 帧,属于过了流畅及格线。在此基础上开启 DLSS 3 帧数终于来到 100+,游戏体验一下子上去了。
《巫师 3:狂猎》自从更新了次世代版,配置要求变得非常恐怖,当然画面表现效果和主机上差距也非常明显,有了光追的加持,看风景的乐趣大大增加。在我们的实测中,默认情况下一样没法跑到 60 帧,在开启 DLSS 2 之后表现和赛博朋克类似,而在 DLSS 3+DLSS 2 的双重 buff 下,也终于够到了 100 帧的尾巴。
最后是优化比较出色的《瘟疫传说:安魂曲》,在 2K 最高画质下即使不开启 DLSS,都能跑到 73 帧,已经很流畅了。开启 DLSS 2 质量能够达到 98 帧,而同时开启 DLSS 2+ DLSS 3 能够到 145 帧,可以完全喂饱 2K / 144Hz 的高刷显示器。
当然,圈子里也流行DLSS 3会导致延迟增加,打游戏不跟手的说法。的确,DLSS 3的本质是 AI 生成全新帧,生成帧是需要一个时间的,这个延迟的提高对于竞技游戏的影响是很大的,但目前支持 DLSS 3 的游戏都是不吃输入延迟的 RPG 游戏。并且在打开 DLSS 3 的帧生成功能时,NVIDIA Reflex 会强制打开,尽量缩短生成帧带来的渲染延迟。我们以《瘟疫传说:安魂曲》为例,开启 DLSS 3 + NVIDIA Reflex 后延迟仅增加了几毫秒,这对于游戏体验是没有影响的。但如果把 DLSS 和 NVIDIA Reflex 都关闭的话,虽然延迟下降明显,但帧数和流畅度方面的折扣也比较大。
还有朋友可能会担心开启 DLSS 后对游戏的画质会不会有很大影响,对此我们从次世代版的《巫师 3: 狂猎》中截取了两张游戏截图,分别为完全关闭 DLSS 状态和同时开启 DLSS 2+DLSS 3 的状态,然后将两张图按相同比例放大对比细节,可以看到放大后几乎看不出什么差别,画质党完全可以放心打开 DLSS。
左:原画质,右:开启 DLSS 2+DLSS 3
左:原画质,右:开启 DLSS 2+DLSS 3
前面我们提到,RTX 4070 的功耗在 200 瓦以内,这是它的一大优势,那么实际游戏中的功耗表现如何?会不会超过 200 瓦呢?我们这里也统计了一下几款游戏的实际功耗表现,所有游戏都是低于 200 瓦的。当然,这样的表现离不开全新 ADA 架构中的 SM 多单元流处理器,它在提升 2 倍性能的同时,还能做到降低功耗,一举两得。
创意生产
得益于 12G 大显存和强大的 CUDA 核心,RTX 4070 不仅可以用来游戏,拿来进行创意生产也不在话下。索泰 RTX4070 X-GAMING OC 欧泊白拥有 5888 个强大的 CUDA 核心,在应对创意生产和深度学习方面会有一定建树。同时,它也可以安装NVIDIA Studio 驱动,有超过 75 款创意应用都可以调用NVIDIA CUDA 核心的AI 算力,大大提高了工作效率。
在建模渲染类软件中,5888 个CUDA核心可以为工作提供硬件加速,目前几乎所有的建模软件都会对 NVIDIA 的 GPU 有优化,所以能做到效率、稳定和兼容性的共存。比如在常用的渲染工具 V-Ray 中,可以借助 RTX 加速的光线追踪,实现高性能最终帧渲染。借助搭载 AI 的降噪功能,GPU 可进一步加速交互式渲染。
在V-Ray Benchmark中,索泰 RTX4070 X-GAMING OC 欧泊白获得了 1860 分,可以顺利应对大部分的建模渲染需求。
同样,进行光线追踪建模渲染自然也没问题,GPU RTX 项目的跑分来到了 2632 分。
在常用渲染器工具 Octane 自带的 BenchMark 中,RTX4070 的渲染能力也是很强的,各项测试中它的渲染能力差不多约等于 4 到 10 张 GTX 980 的算力,进步可以说是显而易见的了。
在视频后期这一块,索泰 RTX4070 X-GAMING OC 欧泊白同样配备第八代 NVIDIA NVENC 编码器,支持 AV1 编码和双编码器。AV1 是下一代的视频编码技术,能够在占用相同空间情况下,提供更加快速的视频编码和更高质量的流媒体传输性能。
AV1 成为趋势既是科技进步的结果,也戳中了行业对于生产力需求的痛点,那就是大幅压缩视频文件的体积大小,同时保证画质几乎不受影响。
我们对此也进行了一项简单的测试,通过剪映专业版软件采用 H264 和 AV1 这两种不同的编码导出同一段视频素材。最终 H264 编码的文件大小为 159MB,而 AV1 编码的文件大小只有 127MB,体积缩小了 21%,但是画质基本看不出区别。
另外,英伟达还为 RTX30/40 系显卡引入了 RTX 视频超分辨率技术,全称为 RTX Video Super Resolution。它可以通过 GPU 的 AI 计算,至多将在线 1080P 视频提升到 4K 分辨率,实现提高清晰度的效果,原理有点像游戏中的 DLSS 技术。同时,AI 算力还可以智能锐化和强化物体、人物的特征和边缘,目前在 Edge 和 Chrome 这样等主流浏览器中播放在线视频都已经支持 VSR 技术,当然它需要占用一定的 GPU 资源用于计算,所以用该技术看视频时最好不要同时玩显卡占用极高的 3A 游戏哦。
↑ 从左至右依次为 1080P 原生画质和 VSR4 超分辨率后的视频画面对比
在创意工作者最常用的非线性编辑软件 Adobe Premiere Pro 中,我们开启 GPU Cuda 加速,然后使用 PugetBenchmark 进行测试。索泰 RTX4070 X-GAMING OC 欧泊白得分为 1532 分,这样的成绩可以轻松应对 4K 甚至 8K 的复杂视频剪辑。
而在特效制作软件 Adobe After Effects 中,我们同样使用 PugetBenchmark 进行测试。最终得分为 1669 分,表现也比较不错。
总结
其实之前我们也评测过欧泊白配色的 RTX4070Ti,这个系列在外观设计上非常有个性,白色系显卡在 DIY 领域也一直是香饽饽,再加上它的价格在大厂显卡里也不算高的,算比较有性价比的一张卡。另外,RTX4070 还是一张能耗比出色的显卡,满载情况下烤机运行 2K 游戏功耗都能控制在 200 瓦以内。
从实测表现上看,索泰 RTX4070 X-GAMING OC 欧泊白在游戏上给的功耗并不是很激进,所以烤机时的温度也比较低,当然性能释放也不弱,所以对优先考虑颜值和静音需求的用户,索泰 RTX4070 X-GAMING OC 欧泊白值得一试。