性能与价格双重碾压! AMD 锐龙9 9900X处理器全面测评

2024.09.19

前段时间，我们刚刚为大家带来了AMD 锐龙7 9700X的首发评测。

    除了“游戏专用U”，Zen5也有更高端版本
    平心而论，9700X很可能是AMD近年来最有诚意的新品之一。这不仅仅是因为它有着比过去更低的首发上市价格，同时也因为其作为AMD新架构（Zen5）首批投向市场的产品之一，选择了“原生8核”这个更利于PC游戏玩家的设计。

再加上大幅改善的功耗和发热，以及明显增强的内存兼容性和A VX512性能，都使锐龙7 9700X的使用成本进一步下降，同时也照顾到了诸如超频、主机模拟器等更多样化PC玩家的“折腾”需求。

    当然，大家都知道，AMD这一代的桌面版Zen5新品并不只有专供游戏的单CCD八核心款式，作为“传统艺能”，采用2CCD+1IOD设计的十二核与十六核版本也会接踵而来。今天我们测试的对象，便是其中的十二核款式锐龙9 9900X。
    产品解析：更大缓存、更低功耗，最重要是价格降了
    众所周知，AMD早在3000系锐龙里就已经开始提供12核版本，因此我们列出了从锐龙9 3900X到这一代锐龙9 9900X为止，四代12核产品的对比表。

    可以看到，与过去的几代产品相比，锐龙9 9900X最明显改变，一是它的价格进一步下探，其二是它的默认TDP和基准频率比上代都有着显著的下降，最后一点就是我们在9700X评测中已经提及，容量增大了50%、带宽翻倍的L1数据缓存。
    其中，降低基准频率和默认TDP显然是最为值得关注的点。因为众所周知，如今CPU的睿频机制与过去已经大不相同，很多时候CPU会根据当前的散热、负载、供电状况，甚至是任务指令集的类型，综合调整当前的频率状态，以往那种“开个高性能模式、CPU就自动锁定最高主频”的时代也早已一去不复返。

正是在这种背景下，现在越来越多的CPU、特别是高端的多核CPU开始采用“低基准、高峰值”的频率设计。在实际使用中，CPU会在一个很大的范围内、不断地自动调整运行频率，从而达到一个更低的平均功耗水平。很显然，这一次的锐龙9 9900X、包括定位更高的9950X，都是这一设计思路下的产物。

    当然，可能有的朋友还是会觉得，“我掏了钱，就应该全程CPU频率拉满才划算”。对于AMD这一代的CPU来说，拉满频率本身其实很简单，基本上只需要在主板BIOS里开启PBO、把功耗上限解锁，只要散热器足够给力（AMD为9900X建议的是使用240mm或更高规格水冷），就能看到CPU几乎全程跑到5.65GHz、甚至更高水准了。
    更多解析：双CCD设计更偏生产力，打游戏需上“科技”
    除了理论规格上的小“秘密”，锐龙9 9900X在实际使用中也存在一些窍门。

我们首先先用CPU-Z来“验明正身”。可以看到，锐龙9 9900X的一级缓存和二级缓存明显是“绑定”每一个核心的。但是它的三级缓存则与过去一样，实际上是分成了两个区域，由两个CCD分别“享有”32MB。

很显然，这就会带来两个CCD之间的核心通讯延迟问题。特别是在对延迟敏感的游戏场景，如果有游戏被调度到了“仅有”4核心的CCD里，而它本身的优化又可以用到超过4核心的CPU资源，那么就可能发生单一程序跨CCD的CPU核心和L3缓存访问。此时突然增大的延迟，就可能会带来游戏帧率的波动，特别是对于1% Low帧的影响会比较明显。

    好在，游戏优化和性能监测软件《游戏加加》最近刚刚上线了新的进程核心分配工具。活用这一“黑科技”，玩家就可以指定游戏进程运行在“8大核”的那个CCD，或者是未来X3D版本具备更大缓存的CCD上，从而更好地优化游戏的瞬时流畅度。
    基准测试：缓存和预测性能极高，架构设计很有特点
    接下来，我们正式进入对锐龙9 9900X的测试环节。
    此次测试使用的主板依旧是升级了最新BIOS的华硕ROG Strix X670E吹雪，内存则是两条共32GB的DDR5-7600MHz。

我们首先测试了锐龙9 9900X的内存和缓存性能。可以看到，与此前的锐龙7 9700X一样，9900X也将L1缓存的读写和复制带宽进行了翻倍。

    锐龙7 9700X的缓存测速成绩
    但与9700X相比，9900X因为本身多了50%的核心，它的L1和L2缓存测速普遍比同架构的8核型号增长了50%左右。有意思的是，虽然9900X拥有“完整的”两组共64MB L3缓存，但它的L3缓存带宽并没有变成单CCD型号的两倍。这可能是因为缓存最终还是需要靠CPU核心去“调动”，所以多50%的核心也就意味着最多可以高50%的缓存吞吐量。

    更有意思的是，我们还对比了使用相同内存配置下酷睿i9 14900K的内存和缓存性能。可以看到，AMD与Intel明显采用了截然不同的缓存设置策略。其中，前者的CPU内部缓存带宽更大、延迟更低，但因为将内存控制器集成在IOD内，因此到CPU的延迟更大。后者则得益于更短的内存控制器到核心路径，外部内存带宽和延迟有优势，但本身较为落后的核心架构又导致核内缓存性能表现拉胯。
    说实话，看到这样的内存和缓存测试数据不禁让我们产生了遐想，如果AMD未来能更积极地采用先进片上互联封装，或许锐龙处理器的整个内存子系统就会迎来翻天覆地的改变。

除了内部缓存带宽飙升之外，9900X在架构层面另外一个巨大的改进点，就在于它更高的分支预测效率。众所周知，锐龙9000系列是AMD首次采用6宽度的执行单元设计，而“宽CPU”能够提高效能的前提，就是良好的分支预测表现。

对比酷睿i9 14900K不难发现，锐龙9 9900X在AIDA64分支预测测试中的得分，达到了竞争对手的两倍还多。这就很好地解释了为什么AMD敢于用相对更低主频、低功耗的产品，去“对位”竞争对手的6GHz高发热旗舰。毕竟更高的分支预测成功率，本身就意味着CPU对于频率，甚至对于内存带宽的需求都会相应下降。

    而且高分支预测成功率也会提高CPU在超线程模式下的执行效率，让超线程能够提供更高的实际性能加成。这一点从CPU-Z自带的多核跑分就可以很清楚地看出来，在单核性能高出4%的前提下，9900X已经达到了前代16核旗舰80%以上的多核性能，同时甚至还超越了同为16核旗舰的锐龙9 5950X的多核性能。
    生产力性能：办公超前代16核，渲染力压线程撕裂者
    在之前测试锐龙7 9700X时，我们就曾明确提及，对于如今的AMD桌面版锐龙产品线来说，“双CCD”的锐龙9系列无论从线程调度、内存延迟，还是单纯的定价策略来看，都更偏向于“用电脑赚钱”的生产力用户。

因此我们也针对性地测试了不少偏办公和创作的场景。比如在7Zip当中，锐龙9 9900X的实测压缩性能就已经超过了前代的7950X（大约138MB/s），而解压性能则相比前代7900X变化不大，这与我们此前测试9700X时得到的结果也相符。

其次在CINEBENCH 2024中，锐龙9 9900X可以跑出单核120、多核1731分的成绩。可以看到，这个多核渲染速度已经超越了Intel的“24大核”至强W，也远远甩开了自家曾经的32核线程撕裂者2990WX。而且最重要的是，我们特意还跑了30分钟的稳定性测试，可以看到，在前述的PBO和高功耗墙设定下，锐龙9 9900X确实能够在高负载场景中跑满5.6GHz的峰值主频。而这一点无论是对比隔壁的14900K、还是自家前代的7000系，明显都要强得多。

接下来是更接近“一般生产力”场景的视频编辑相关测试。首先是x265的编码测速，在4K的预设分辨率下，锐龙9 9900X可以跑出34.74FPS的纯CPU编码速度。

    在复杂一些的Adobe Media Encoder转码项目中，在纯CPU加速模式、4K分辨率的H.265+高比特率设定下，锐龙9 9900X仅用时4分10秒就完成了11分55秒的视频转码工作。
    进阶生产力测试：核显加速出奇效，A VX512能跑大模型
    接下来，我们进入更复杂一些的生产力测试项目。首先是100GB素材的PR视频合成渲染测试，我们也选择仅用CPU进行软编码。锐龙9 9900X用时14分41秒80就完成了100GB素材向4K视频的合成渲染，生成了大约12分钟的视频内容。

不过这种“使用方式”，实际上是浪费了9900X的架构潜力。因为在它的核心里除了CPU、缓存和内存控制器之外，同样也包含一颗2CU配置的RDNA2核显。

原则上来说，这个核显可以作为“亮机卡”使用，但如果将它与AMD自家的Radeon独显搭配，那么核显与独显将能够激活名为“Smart Access Video”的协同编码功能，通过同时使用两个GPU的视频单元，来实现更高速的视频编解码。

从我们的实测来看，在换用GPU硬件加速、并激活双GPU协同编码后，同样的100GB素材就只需要9分58秒就能完成导出。

有的朋友可能会说，怎么能够证明锐龙9 9900X里的核显就能起到协同编码加速的作用呢？很简单，因为我们还准备了一套酷睿i9 14900K平台，并配备完全相同的内存和Radeon RX7900 XT独显，进行了相同素材和分辨率设定下的视频导出。结果显示用时11分17秒85，明显速度慢了一些。由此可知，对于多媒体生产力用户来说，锐龙9 9900X的这颗2CU核显还真可以起到一些作用。

我们前面其实已经提及，锐龙9000系列这次最大的架构改进之一，是其大幅提升了A VX512指令集的执行效率。那么对于生产力用户来说，这一优势到底又要如何体现呢？

    很简单，本地AI推理就能用到A VX512指令集，同时也是非常典型的重负载场景。为此我们也搭建了一个340亿参数量的本地离线GPT-4对话场景。在这个场景中，锐龙9 9900X实测可以保持在2.9-3.2Tokens每秒的推理速率，实现流畅的“人机对话”并没有什么问题。
    综合上面基准和生产力测试来看，锐龙9 9900X此次的架构改进绝对可以说是“针对性十足”。一方面在竞争对手受困于制程短板和架构缺陷，不得不先后放弃A VX-512和超线程时，AMD反而在先进工艺和优秀市场表现的双重助推下，“迎难而上”地强化A VX-512指令集的效率，并大幅提升了Zen5架构的超线程和指令预测性能。
    以结果来说，这就使得以9900X为代表的这一代锐龙9系列桌面CPU，获得了在重负载多媒体编辑、AI推理等高度专业场景下的大幅性能增长。很显然，这会有利于他们在专业领域抢占更多的市场份额，而且考虑到这类用户往往有着更高的黏性，因此甚至可能会对AMD的长期财务状况带来潜移默化的良好影响。
    游戏测试：搭配旗舰独显，高画质“摸鱼”没压力
    虽然从产品定位和性价比的角度来说，锐龙9 9900X并不是一款“专为游戏而生”的CPU。但假如除了工作之外、还想拿它来打打游戏，那么这款12核的Zen5桌面U是否又能Hold住呢？答案是肯定的，由于现在很多游戏对多核的优化和依赖越来越高，多大核设计在游戏中的优势也逐步凸显，所以使得锐龙9 9900X的游戏性能确实让人眼前一亮。

只要游戏本身的核心调度得当，锐龙9 9900X当然不会存在性能上的不足。当负载高于8线程之后，它的优势更会显现出来。

    在进一步的单机与网游实测中，锐龙9 9900X搭配Radeon RX7900XT确实也能将其性能充分发挥出来，在2K分辨率+最高画质的设定下提供绝对足够流畅的游戏体验。甚至在多款3A大作中，锐龙9 9900X搭配Radeon RX7900XT的表现，都要比价格贵得多的14900K搭配相同显卡略胜一筹。所以至少对于想“摸鱼”的朋友来说，这样的游戏性能肯定是绰绰有余了。
    总结：提速降价诚意足，AMD和用户“双赢”
    总的来说，与此前已经开售的锐龙7 9700X相比，锐龙9 9900X作为新架构目前门槛最低的“2CCD”型号，多了50%的核心数量以及更高的内部缓存带宽，都是它极为明显的不同之处。

对于重视并行处理能力的高负载创作场景而言，锐龙9 9900X明显更高的指令效率以及大幅减少的功耗设计，使得其在生产力场景中能够提供显著的速度优势，同时它更是表现出了优秀的高能效特性。别的不说，重负载渲染场景下频率能够长时间“跑满”，以及内置的核显可以在视频创作环节起到显著的加速效果，这些都会令用户对AMD这款新架构12核CPU感到惊喜。

除此之外，得益于相关线程分配工具的及时上线，锐龙9 9900X的游戏表现也得到了“首发优化”。因此对于游戏场景来说，只要锁定核心簇运行，它的表现就不会输给价位更高的竞争对手。

正如我们前面已经讲到过的那样，锐龙9 9900X的性能表现，也在一定程度上让人对AMD未来的产品有了更多的好奇。当然，这都是后话。至少对于目前的消费者来说，AMD给锐龙9 9900X定下3399元的售价，这个定价相较锐龙7000系列7900X首发的4299元来说，直接降了900元。再加上本就“碾压性”的实测性能表现，也使得如今AMD想要“趁热打铁”、获得更多市场份额的意图变得既明显，而且也更易于达成。这对于消费者来说，毫无疑问会是好事一桩。