性能与价格双重碾压! AMD 锐龙9 9900X处理器全面测评


    前段时间,我们刚刚为大家带来了AMD 锐龙7 9700X的首发评测。
    
    除了“游戏专用U”,Zen5也有更高端版本
    平心而论,9700X很可能是AMD近年来最有诚意的新品之一。这不仅仅是因为它有着比过去更低的首发上市价格,同时也因为其作为AMD新架构(Zen5)首批投向市场的产品之一,选择了“原生8核”这个更利于PC游戏玩家的设计。
    
    再加上大幅改善的功耗和发热,以及明显增强的内存兼容性和A VX512性能,都使锐龙7 9700X的使用成本进一步下降,同时也照顾到了诸如超频、主机模拟器等更多样化PC玩家的“折腾”需求。
    
    当然,大家都知道,AMD这一代的桌面版Zen5新品并不只有专供游戏的单CCD八核心款式,作为“传统艺能”,采用2CCD+1IOD设计的十二核与十六核版本也会接踵而来。今天我们测试的对象,便是其中的十二核款式锐龙9 9900X。
    产品解析:更大缓存、更低功耗,最重要是价格降了
    众所周知,AMD早在3000系锐龙里就已经开始提供12核版本,因此我们列出了从锐龙9 3900X到这一代锐龙9 9900X为止,四代12核产品的对比表。
    
    可以看到,与过去的几代产品相比,锐龙9 9900X最明显改变,一是它的价格进一步下探,其二是它的默认TDP和基准频率比上代都有着显著的下降,最后一点就是我们在9700X评测中已经提及,容量增大了50%、带宽翻倍的L1数据缓存。
    其中,降低基准频率和默认TDP显然是最为值得关注的点。因为众所周知,如今CPU的睿频机制与过去已经大不相同,很多时候CPU会根据当前的散热、负载、供电状况,甚至是任务指令集的类型,综合调整当前的频率状态,以往那种“开个高性能模式、CPU就自动锁定最高主频”的时代也早已一去不复返。
    
    正是在这种背景下,现在越来越多的CPU、特别是高端的多核CPU开始采用“低基准、高峰值”的频率设计。在实际使用中,CPU会在一个很大的范围内、不断地自动调整运行频率,从而达到一个更低的平均功耗水平。很显然,这一次的锐龙9 9900X、包括定位更高的9950X,都是这一设计思路下的产物。
    
    当然,可能有的朋友还是会觉得,“我掏了钱,就应该全程CPU频率拉满才划算”。对于AMD这一代的CPU来说,拉满频率本身其实很简单,基本上只需要在主板BIOS里开启PBO、把功耗上限解锁,只要散热器足够给力(AMD为9900X建议的是使用240mm或更高规格水冷),就能看到CPU几乎全程跑到5.65GHz、甚至更高水准了。
    更多解析:双CCD设计更偏生产力,打游戏需上“科技”
    除了理论规格上的小“秘密”,锐龙9 9900X在实际使用中也存在一些窍门。
    
    我们首先先用CPU-Z来“验明正身”。可以看到,锐龙9 9900X的一级缓存和二级缓存明显是“绑定”每一个核心的。但是它的三级缓存则与过去一样,实际上是分成了两个区域,由两个CCD分别“享有”32MB。
    
    很显然,这就会带来两个CCD之间的核心通讯延迟问题。特别是在对延迟敏感的游戏场景,如果有游戏被调度到了“仅有”4核心的CCD里,而它本身的优化又可以用到超过4核心的CPU资源,那么就可能发生单一程序跨CCD的CPU核心和L3缓存访问。此时突然增大的延迟,就可能会带来游戏帧率的波动,特别是对于1% Low帧的影响会比较明显。
    
    好在,游戏优化和性能监测软件《游戏加加》最近刚刚上线了新的进程核心分配工具。活用这一“黑科技”,玩家就可以指定游戏进程运行在“8大核”的那个CCD,或者是未来X3D版本具备更大缓存的CCD上,从而更好地优化游戏的瞬时流畅度。
    基准测试:缓存和预测性能极高,架构设计很有特点
    接下来,我们正式进入对锐龙9 9900X的测试环节。
    此次测试使用的主板依旧是升级了最新BIOS的华硕ROG Strix X670E吹雪,内存则是两条共32GB的DDR5-7600MHz。
    
    我们首先测试了锐龙9 9900X的内存和缓存性能。可以看到,与此前的锐龙7 9700X一样,9900X也将L1缓存的读写和复制带宽进行了翻倍。
    
    锐龙7 9700X的缓存测速成绩
    但与9700X相比,9900X因为本身多了50%的核心,它的L1和L2缓存测速普遍比同架构的8核型号增长了50%左右。有意思的是,虽然9900X拥有“完整的”两组共64MB L3缓存,但它的L3缓存带宽并没有变成单CCD型号的两倍。这可能是因为缓存最终还是需要靠CPU核心去“调动”,所以多50%的核心也就意味着最多可以高50%的缓存吞吐量。
    
    更有意思的是,我们还对比了使用相同内存配置下酷睿i9 14900K的内存和缓存性能。可以看到,AMD与Intel明显采用了截然不同的缓存设置策略。其中,前者的CPU内部缓存带宽更大、延迟更低,但因为将内存控制器集成在IOD内,因此到CPU的延迟更大。后者则得益于更短的内存控制器到核心路径,外部内存带宽和延迟有优势,但本身较为落后的核心架构又导致核内缓存性能表现拉胯。
    说实话,看到这样的内存和缓存测试数据不禁让我们产生了遐想,如果AMD未来能更积极地采用先进片上互联封装,或许锐龙处理器的整个内存子系统就会迎来翻天覆地的改变。
    
    除了内部缓存带宽飙升之外,9900X在架构层面另外一个巨大的改进点,就在于它更高的分支预测效率。众所周知,锐龙9000系列是AMD首次采用6宽度的执行单元设计,而“宽CPU”能够提高效能的前提,就是良好的分支预测表现。
    
    对比酷睿i9 14900K不难发现,锐龙9 9900X在AIDA64分支预测测试中的得分,达到了竞争对手的两倍还多。这就很好地解释了为什么AMD敢于用相对更低主频、低功耗的产品,去“对位”竞争对手的6GHz高发热旗舰。毕竟更高的分支预测成功率,本身就意味着CPU对于频率,甚至对于内存带宽的需求都会相应下降。
    
    而且高分支预测成功率也会提高CPU在超线程模式下的执行效率,让超线程能够提供更高的实际性能加成。这一点从CPU-Z自带的多核跑分就可以很清楚地看出来,在单核性能高出4%的前提下,9900X已经达到了前代16核旗舰80%以上的多核性能,同时甚至还超越了同为16核旗舰的锐龙9 5950X的多核性能。
    生产力性能:办公超前代16核,渲染力压线程撕裂者
    在之前测试锐龙7 9700X时,我们就曾明确提及,对于如今的AMD桌面版锐龙产品线来说,“双CCD”的锐龙9系列无论从线程调度、内存延迟,还是单纯的定价策略来看,都更偏向于“用电脑赚钱”的生产力用户。
    
    因此我们也针对性地测试了不少偏办公和创作的场景。比如在7Zip当中,锐龙9 9900X的实测压缩性能就已经超过了前代的7950X(大约138MB/s),而解压性能则相比前代7900X变化不大,这与我们此前测试9700X时得到的结果也相符。
    
    
    其次在CINEBENCH 2024中,锐龙9 9900X可以跑出单核120、多核1731分的成绩。可以看到,这个多核渲染速度已经超越了Intel的“24大核”至强W,也远远甩开了自家曾经的32核线程撕裂者2990WX。而且最重要的是,我们特意还跑了30分钟的稳定性测试,可以看到,在前述的PBO和高功耗墙设定下,锐龙9 9900X确实能够在高负载场景中跑满5.6GHz的峰值主频。而这一点无论是对比隔壁的14900K、还是自家前代的7000系,明显都要强得多。
    
    接下来是更接近“一般生产力”场景的视频编辑相关测试。首先是x265的编码测速,在4K的预设分辨率下,锐龙9 9900X可以跑出34.74FPS的纯CPU编码速度。
    
    在复杂一些的Adobe Media Encoder转码项目中,在纯CPU加速模式、4K分辨率的H.265+高比特率设定下,锐龙9 9900X仅用时4分10秒就完成了11分55秒的视频转码工作。
    进阶生产力测试:核显加速出奇效,A VX512能跑大模型
    接下来,我们进入更复杂一些的生产力测试项目。首先是100GB素材的PR视频合成渲染测试,我们也选择仅用CPU进行软编码。锐龙9 9900X用时14分41秒80就完成了100GB素材向4K视频的合成渲染,生成了大约12分钟的视频内容。
    
    不过这种“使用方式”,实际上是浪费了9900X的架构潜力。因为在它的核心里除了CPU、缓存和内存控制器之外,同样也包含一颗2CU配置的RDNA2核显。
    
    原则上来说,这个核显可以作为“亮机卡”使用,但如果将它与AMD自家的Radeon独显搭配,那么核显与独显将能够激活名为“Smart Access Video”的协同编码功能,通过同时使用两个GPU的视频单元,来实现更高速的视频编解码。
    
    从我们的实测来看,在换用GPU硬件加速、并激活双GPU协同编码后,同样的100GB素材就只需要9分58秒就能完成导出。
    
    有的朋友可能会说,怎么能够证明锐龙9 9900X里的核显就能起到协同编码加速的作用呢?很简单,因为我们还准备了一套酷睿i9 14900K平台,并配备完全相同的内存和Radeon RX7900 XT独显,进行了相同素材和分辨率设定下的视频导出。结果显示用时11分17秒85,明显速度慢了一些。由此可知,对于多媒体生产力用户来说,锐龙9 9900X的这颗2CU核显还真可以起到一些作用。
    
    我们前面其实已经提及,锐龙9000系列这次最大的架构改进之一,是其大幅提升了A VX512指令集的执行效率。那么对于生产力用户来说,这一优势到底又要如何体现呢?
    
    很简单,本地AI推理就能用到A VX512指令集,同时也是非常典型的重负载场景。为此我们也搭建了一个340亿参数量的本地离线GPT-4对话场景。在这个场景中,锐龙9 9900X实测可以保持在2.9-3.2Tokens每秒的推理速率,实现流畅的“人机对话”并没有什么问题。
    综合上面基准和生产力测试来看,锐龙9 9900X此次的架构改进绝对可以说是“针对性十足”。一方面在竞争对手受困于制程短板和架构缺陷,不得不先后放弃A VX-512和超线程时,AMD反而在先进工艺和优秀市场表现的双重助推下,“迎难而上”地强化A VX-512指令集的效率,并大幅提升了Zen5架构的超线程和指令预测性能。
    以结果来说,这就使得以9900X为代表的这一代锐龙9系列桌面CPU,获得了在重负载多媒体编辑、AI推理等高度专业场景下的大幅性能增长。很显然,这会有利于他们在专业领域抢占更多的市场份额,而且考虑到这类用户往往有着更高的黏性,因此甚至可能会对AMD的长期财务状况带来潜移默化的良好影响。
    游戏测试:搭配旗舰独显,高画质“摸鱼”没压力
    虽然从产品定位和性价比的角度来说,锐龙9 9900X并不是一款“专为游戏而生”的CPU。但假如除了工作之外、还想拿它来打打游戏,那么这款12核的Zen5桌面U是否又能Hold住呢?答案是肯定的,由于现在很多游戏对多核的优化和依赖越来越高,多大核设计在游戏中的优势也逐步凸显,所以使得锐龙9 9900X的游戏性能确实让人眼前一亮。
    
    
    
    
    只要游戏本身的核心调度得当,锐龙9 9900X当然不会存在性能上的不足。当负载高于8线程之后,它的优势更会显现出来。
    
    
    
    在进一步的单机与网游实测中,锐龙9 9900X搭配Radeon RX7900XT确实也能将其性能充分发挥出来,在2K分辨率+最高画质的设定下提供绝对足够流畅的游戏体验。甚至在多款3A大作中,锐龙9 9900X搭配Radeon RX7900XT的表现,都要比价格贵得多的14900K搭配相同显卡略胜一筹。所以至少对于想“摸鱼”的朋友来说,这样的游戏性能肯定是绰绰有余了。
    总结:提速降价诚意足,AMD和用户“双赢”
    总的来说,与此前已经开售的锐龙7 9700X相比,锐龙9 9900X作为新架构目前门槛最低的“2CCD”型号,多了50%的核心数量以及更高的内部缓存带宽,都是它极为明显的不同之处。
    
    对于重视并行处理能力的高负载创作场景而言,锐龙9 9900X明显更高的指令效率以及大幅减少的功耗设计,使得其在生产力场景中能够提供显著的速度优势,同时它更是表现出了优秀的高能效特性。别的不说,重负载渲染场景下频率能够长时间“跑满”,以及内置的核显可以在视频创作环节起到显著的加速效果,这些都会令用户对AMD这款新架构12核CPU感到惊喜。
    
    除此之外,得益于相关线程分配工具的及时上线,锐龙9 9900X的游戏表现也得到了“首发优化”。因此对于游戏场景来说,只要锁定核心簇运行,它的表现就不会输给价位更高的竞争对手。
    
    正如我们前面已经讲到过的那样,锐龙9 9900X的性能表现,也在一定程度上让人对AMD未来的产品有了更多的好奇。当然,这都是后话。至少对于目前的消费者来说,AMD给锐龙9 9900X定下3399元的售价,这个定价相较锐龙7000系列7900X首发的4299元来说,直接降了900元。再加上本就“碾压性”的实测性能表现,也使得如今AMD想要“趁热打铁”、获得更多市场份额的意图变得既明显,而且也更易于达成。这对于消费者来说,毫无疑问会是好事一桩。