AMD RX 9070 AI 跑分评测对比 9070 XT、7800 XT、英伟达 RTX 5070、4070
本月初,我们分享了 AMD 新款 RX 9070 评测的第一部分。我们对这款 GPU 的游戏性能给予了 7.5 分(满分 10 分)。相比之下,9070 XT 则获得了满分 10 分。
非 XT 版得分较低的主要原因是价格相对较高,因此与 XT 版相比价值较低。我们认为其价格与 XT 相差甚远。
虽然事实证明 RX 9070 比 XT 更省电,但对于桌面游戏显卡来说,价值和性能通常比省电更重要。
然而,就生产效率而言,情况可能并非如此,因为生产效率也会考虑到省电等因素。因此,与我们为 XT 机型所做的评测类似,我们也为 RX 9070 做了专门的生产力评测,将其与 9070 XT、7800 XT 以及英伟达的 5070 和 4070 进行比较。
在当今世界,人工智能性能是一个非常重要的指标,而 AMD 也承诺,由于其底层架构的改进,人工智能性能将得到大幅提升。我们已经在 XT 型号上尝到了甜头,现在是时候看看非 XT 在这方面的表现如何了。
在我们开始之前,这是 Sayan Sen(作者)和 Steven Parker 之间的一次合作。下面是测试电脑的规格:
- 酷冷至尊 MasterBox NR200P MAX
- 华擎 Z790 PG-ITX/TB4 主板
- 英特尔酷睿 i7-14700K,Thermal Grizzly Carbonaut
- T-FORCE Delta RGB DDR5 (2x16GB) 7600MT/s CL36 (XMP 配置文件)
- 2TB 金士顿 Fury Renegade SSD
- Windows 11 24H2(内部版本 26100.3194)
7800 XT、9070 XT 和 9070 使用的驱动程序是 Adrenaline v24.30.31.03 / 25.3.1 RC(AMD 提供的新闻驱动程序),英伟达 RTX 5070 和 4070 使用的是 GeForce v572.47。
首先是在 ONNX 上运行 Geekbench AI:
在量化和单精度(FP32)性能方面,RTX 5070 不敌 9070 XT 和 9070。同样,4070 在半精度(FP16)性能方面接近 9070,但后者在量化分数方面快了 30%,在单精度(FP32)方面快了近 12.2%。
造成这种差距的原因在于每块显卡的可用内存量。英伟达 GPU 每块有 12GB,因此只在 FP16 精度测试中表现较好,因为其他测试更需要 VRAM。
接下来,我们进入 UL Procyon 套件,首先进行图像生成基准测试:
我们选择了 Stable Diffusion XL FP16 测试,因为这是 Procyon 套件上强度最高的工作负载。与我们在 Geekbench AI 上看到的情况类似,英伟达 GPU 在这里的表现相对更好,因为它是 FP16 或半精度,这意味着使用的 VRAM 更低。
因此,这一点需要再次牢记,如果你希望浮动 32 AI 工作负载,那么拥有 12 GB 以上缓冲区的显卡很可能会胜出。
与 7800 XT 相比,RX 9070 仍有很大的提升,我们可以看到约 54% 的增益。这种提升主要归功于核心架构本身的改进,因为两款显卡的 VRAM 容量相同,都是 16GB。
图像生成之后,我们进入文本生成基准测试:
在这个工作负载中,我们看到 9070 的性能比 7800 XT 提升的幅度最小。前者在这里的速度提高了约 7.25%。在 Phi 和 Mistral 模型中,9070 的表现也不如英伟达 4070,不过它在 Llama 两项测试中的表现确实更好。
还有一个奇怪的结果,在 Llama 2 中,5070 的性能低于包括 7800 XT 在内的所有显卡。我们将每项测试运行了三次,并考虑了最佳成绩,因此我们并不清楚这里发生了什么。
在结束人工智能测试后,我们在 Geekbench 计算基准中测量了 OpenCL 吞吐量。
RX 9070 在这方面表现不佳,甚至落后于 7800 XT,速度明显低于其他三款显卡。有趣的是,即使是 RTX 5070 也无法在 OpenCL 上击败 4070,因此这或许表明这次无论是 AMD 还是英伟达都没有将 OpenCL 优化放在首位。这也可能是 Geekbench 本身的问题。
总结
我们对 9070 的生产力性能评测到此结束,不得不说,我们对其印象相当深刻,但也有些许失望。很明显,当推理精度较高时,9070 以及 9070 XT 确实会大放异彩,这是因为与英伟达 5070 相比,它们拥有更高的内存缓冲区。但在 FP16 上,英伟达显卡拔得头筹。
RNDA 4(包括 RX 9070)仍然比 RDNA 3(7800 XT)有很大提升。正如我们在图像生成基准测试中注意到的那样,在高强度负载下,显卡的性能提升超过了 50%。
那么,作为一款生产力硬件,我们如何评价 RX 9070 呢?我们认为这是一款不错的显卡。如果有人正在寻找一款 550 美元左右的 GPU,既能玩游戏,又能完成一些人工智能任务,那么这款显卡是不错的选择,尤其是在处理单精度情况或其他一些 VRAM 密集型任务时。而且我们已经知道它非常高效,这也是它的优势所在。
对于那些正在寻找能处理更多任务的 GPU 的用户,AMD 最近发布了 Radeon AI PRO R9700,它基本上是 9070 XT 的 32 GB 升级版,并增加了一些基于工作站的优化。
综合考虑,我们给 AMD RX 9070 的人工智能性能打 9 分(满分 10 分)。与那些考虑将 GPU 用于游戏的用户相比,对于那些着眼于生产力的用户来说,价格并不是一个重要因素。
原文/Neowin
评论功能已关闭