英伟达新卡跑AI超越4张5090!功耗还更低
据外媒报道,NVIDIA新显卡RTX Pro 6000 Blackwell的表现说明,在运行大型AI模型时,高端单卡有时比主流多卡方案更高效,甚至能接近甚至超过四张NVIDIA GeForce RTX 5090。
在一项测试中,使用了2300亿参数模型MiniMax M2.7,在统一的IQ3_XXS量化、32K上下文和4096最大token设置下,对比了四种配置:
4×NVIDIA GeForce RTX 4090(96GB):71.52 tok/s,TTFT 1045ms
4×NVIDIA GeForce RTX 5090(128GB):120.54 tok/s,TTFT 725ms
1×NVIDIA RTX Pro 6000 Blackwell(96GB):118.74 tok/s,TTFT 765ms
NVIDIA DGX Spark(128GB):24.41 tok/s,TTFT 741ms

从生成速度来看,单张RTX Pro 6000几乎追平四张5090,而明显领先四张4090;DGX Spark则由于定位不同,性能较低。
但关键不只是速度,还有功耗差异:
4×4090:约1800W
4×5090:约2300W
RTX Pro 6000:约600W
DGX Spark整机:约240W
也就是说,RTX Pro 6000只用四分之一的功耗,就能接近四张5090的性能。

价格方面:
RTX 4090:约3000美元/张
RTX 5090:约3500美元/张(四张约14000美元)
RTX Pro 6000:约9500美元
DGX Spark:约4699美元
总体来看,多卡虽然能叠加显存,但也会带来通信开销和效率损失;而大显存单卡在性能、功耗和成本之间反而更均衡,尤其是在运行超大模型时优势明显。
本文由制作发布,未经允许禁止转载。
- 1和平精英
-
1
- 2香肠派对
-
2
- 3火龙复古
-
3
- 4暗黑破坏神2.7 重制版
-
4
- 5战场女神
-
5
- 6战神之决战西伯利亚
-
6
- 7黎明召唤
-
7
- 8超神之刃
-
8




三国:谋定天下
侠盗猎车手:罪恶都市
离火之境
幻唐志
辐射:避难所Online
王者荣耀














