迈向光追新次元——华硕ASUS TUF GAMING RTX 3080 10G评测

迈向光追新次元——华硕ASUS TUF GAMING RTX 3080 10G评测
2018年的那个秋天,NVIDIA 图灵核心显卡把我们带入了一个名叫光线追踪的新世界,美奂绝伦的特效让玩家们心驰神往。但受到图灵显卡的性能所限,我们在游戏中完整无法领略光线追踪的魅力。
两年过去了,就在不久前Ampere架构GPU携带多项重要改进让玩家看到了4K光追的希望。我们在第一时间拿到了来自华硕的RTX 3080显卡。与以往不同的是,第一个来的不是信仰满满的ROG STRIX,也不是入门级别的DUAL ,而是显卡产品中的新秀TUF GAMING系列。


开箱

黑色略带磨砂质感的包装盒,有几个重要信息点值得注意:


l 首先是10GB GDDR6X,这里创下了两个第一次:这是NVIDIA游戏卡第一次使用10GB这个容量的显存,这也是GDDR6X显存首次正式与消费者见面l 接下来是PCI-E 4.0,虽然友商早在一年前就推出了PCI-E 4.0的显卡,而对于NVIDIA来说这还是头一回l TUF GAMING的LOGO,正中间偏右上一点点的那个。还记得TUF GAMING系列以前采用那个小翅膀的LOGO吗?现在变得更加硬核,棱角分明的TUF三个字母的艺术组合,也是TUF GAMING系列从年轻走向成熟的标志

显卡本体,棱角分明的正面被三枚9CM风扇占据了大部分空间。仔细观察的话会发现正中间那枚风扇的旋转方向和另外两个相反,这样的设计效果究竟如何我们后面会有散热方面的测试

正面的风扇罩告别了塑料,与背板相同都是全铝材质为庞大的显卡提供支撑。

厚度方面依然是2.7槽的设计,相比三槽卡还是苗条了那么一点点。具体三维是299.9*126.9*51.7mm

从尾部看过去,散热器总共由六根热管贯穿来保障散热效果

很可惜RTX30系列显卡取消了Type-c接口,多少让人觉得有些遗憾。想要使用Type-C一线通显示器的用户需要寻找带有DP-IN的全功能雷电3的主板了 不过也有好消息,RTX30系列显卡的HDMI接口提升为HDMI2.1,让4K120HZ不再是DP接口的专利 TUFGAMING RTX3080为我们提供了三个DP1.4和两个HDMI2.1接口,相比Founder's Edition多了一个HDMI,用来满足多屏用户需求。视频I/O挡板采用了304不锈钢抛光处理,质感十足

供电输入方面TUF GAMING RTX3080显卡保留了传统的双8pin接口可以输入300W的超大功率,相比Founder’s Edition那略为奇葩的12pin具有更好的兼容性。与此同时TUF GAMING RTX3080显卡还保留了模式切换开关,可以在静音模式和性能模式之间切换

从显卡背面可以看出来显卡的PCB实际上是没有散热器长的,留出了一部分镂空以增强通风效果

拆解



将散热器打开之后我们看到了TUF GAMING RTX3080显卡的内部的样子


六热管散热器在规模方面与上一代的ROG STRIX不相上下,铜底镀镍后还做了抛光处理,做工精湛

显存和MOSFET的散热处理更是让人感到耳目一新,热管连接带有鳍片的散热模组取代了以往传统简单的铝制中框。由于有鳍片的加入,无疑会大幅提高散热面积从而更好的降低周边温度

再来看一下PCB。虽然长度变短,但原件没并没有减少,所以显得整个版面上十分拥挤。这也从侧边说明了一个问题,缩短PCB只是为了更好的通风而不是为了缩水。 粗略地点一下,TUF GAMING RTX3080显卡总共使用了20个超合金电感,意味着供电总数达到了规模空前的20相

虽然TUF GAMING RTX3080显卡全身只有右上角那个LOGO灯会亮,但华硕依然没有忘记带上他一起来做AURA SYNC

GA102-200GPU核心采用了三星8NM工艺,628平方毫米的面积容纳了28亿晶体管,不由得让人感叹科技的进步

正面采用了10颗编号为D8BGW的镁光GDDR6X显存,单颗容量1GB,运行速度为19Gbps,320bit位宽。显存总带宽达到了760GB/S

接下来说说那夸张的供电吧,首先可以在显卡尾部看到两颗UP9512的PWM控制器。这款支持NVIDIAOpen VReg Type 4i + PWMVID技术的8相PWM主控深受厂商欢迎,从图灵时代便大量应用在NVIDIA显卡上,TUF GAMING RTX3080使用两颗控制16相核心供电

PCB右侧的12相GPU供电,MOSFET全部采用威世半导体的SIC641,这是一款55A的DrMos

另外一侧还有一颗UP9512用来控制4相显存供电

GPU左边的4+4相供电,MOSFET与右侧用料一致。这样整片TUF GAMING RTX 3080显卡拥有16+4相的供电配置,甚至高过上一代的旗舰产品ROG STRIX RTX 2080TI

输出电容一律采用330微法钽电容,非常的奢侈

在显卡供电模组中并不怎么重要的输入部分也做得非常仔细

输入电容都是MIL 5K黑金电容

除了已经无处落脚的正面以外,TUF GAMING RTX3080对于背部空间也没有浪费,两大排的SP-CAP电容让人觉得幸福满满



GPU背面一大堆的MLCC电容为核心提供更纯净的电流

以往讲到显卡到用料,一般都会说几个电容、几个电感这样的准确数量词。而这次到TUF GAMING RTX3080有些颠覆传统了,我实在想不出来什么更好到形容词来描述这奢侈的用料,只能用一堆、一排来形容了
最新型的安培架构



9月初NVIDIA发布Ampere架构显卡的时候介绍了一大堆的新鲜事物,我在这里捡重点的给大家简单复习一下当我第一眼看到Ampere架构的GPU的CUDA核心数量的时候被吓了一跳,Ampere GPU究竟是用了何种黑科技居然能将CUDA数量翻了一倍还多。经过仔细研究之后,发现了其中的奥妙所在。 下面这个是Ampere架构一个SM的结构图。

在上一代的Turing核心中,整型运算单元和单精度浮点单元各司其职,进行着互不影响的并行运算。但是在长期的游戏运行中NVIDIA发现整型运算的需求要远远小于单精度浮点。于是NVIDIA在Ampere架构中引入了一种同时能够处理整型和单精度浮点两种数据类型的运算单元,这样就使得Ampere在处理纯粹的单精度浮点运算时,相比Turing拥有多一倍的单精度浮点单元。所以Ampere的CUDA核心数量才会翻了一番还多

GDDR6X显存的应用,更是让Ampere的显存带宽逼近了1TB/S

最新TUF VS 上代猛禽


TUFGAMING RTX3080的外观尺寸是299.9*126.9*51.7mm,这么说大家可能会觉得比较抽象。ROG STRIX显卡大家很多人都见过,我们就拿上一代的旗舰卡ROG STRIXRTX2080TI来比一下


从这几个角度的对比来看,两张显卡尺寸几乎一模一样。但是TUF GAMINGRTX3080的那个LOGO灯突出一块,再加上双8PIN供电接口并没有像上一代STRIX那样做下沉处理,所以实际TUF GAMING RTX3080的兼容性会比上一代的ROG STRIX略差,主要是对于机箱的宽度要求会更高一点

与ROG STRIX X570-I在裸机下的安装效果。虽然大了点,但还算没有过于的突兀

装机在ROG 太阳神机箱中,感受ROG全家桶的信仰加成

与ROG MAXIMUS XII EXTREME在黑暗中的灯光效果

基准性能测试



在做这代显卡的性能测试时,我遇到了史无前例的尴尬局面。目前市面上游戏性能最好的处理器无疑是INTEL I9-10900K,这点恐怕连友商也无法反驳。但是10900K仅支持PCI-E 3.0,有会对显卡的带宽产生负面作用。之前的PCI-E4.0的显卡RX5700XT性能相对没有那么强大,PCI-E 3.0带宽不足以对他造成影响,而RTX3080则不同。比如在《地平线:零之曙光》的测试中,可以很明显的发现在1920*1080与2560*1440这两个分辨率下,INTEL平台的表现要好于AMD平台;而分辨率上升为4K之后情况得到逆转(左边10900K+M12E,右边3900X+X570-I,显卡驱动版本为456.16)。


当然也并不是所有游戏都会这样,比如《荒野大镖客2》在2K以上两个平台就没什么区别,3DMARK跑出来的图形分,两个平台也基本一致。CPU的游戏性能与PCI-E带宽到达了一个不可调和两难取舍的境地。没办法,我也只好二选一。我在这里选择了INTELI9-10900K,毕竟目前1080P和2K分辨率的显示器相比4K要更主流一点。所以我的测试平台是这样的

最新版本到GPU-Z已经可以正确识别RTX3080的各项参数了,GA102的Cuda总核心数为8704个,正好是上一代RTX2080TI的TU102的两倍,可见规格至强大 搭配3900X和X570I可以正确工作在PCI-E4.0 X16的模式下

默认的GPU频率为1440MHz,Boost频率为1710Mhz。然而实际运行频率要远远高于这两个数值。在3DMark TimeSpy压力测试的过程中,大部分时间GPU核心频率都在1850MHz上下徘徊,最高可以突破1900MHz

3DMARKTIMESPY和TIME SPY EXTREME的跑分



在3DMARK的几项高要求测试中,RTX3080对RTX2080TI都体现出了较大优势,领先幅度达到20%以上,并且随着分辨率的提高而增大

光追与DLSS


实时光线追踪与DLSS是RTX显卡的两大杀手级应用,前者是提高画质而后者是提高性能。这么说可能有点抽象,下面我来举个例子 这是游戏《Deliver Us The Moon》中刚开头的一个场景,下图是没有开启实时光线追踪的效果

下图是开到最高档实时光线追踪的效果

这样看起来或许不够直观,做个gif拼起来更明显。怎么样,是不是看起来像两个游戏了 《Deliver Us The Moon》中一共有4档的光线追踪选项,受限于附件大小只能压缩一下分辨率了,大家可以看看下面的动图来体会一下区别

开启了非凡的特效,自然就是损失一些帧数了。我们看到在《Deliver Us The Moon》,无论是上一代的RTX2080TI还是最新的RTX3080,在开启实时光线追踪后都要损失掉大约一半的帧率

类似的情况也存在于其他支持实时光线追踪的游戏中,比如《古墓丽影:暗影》和《地铁:离去》等等

虽然在《Deliver Us The Moon》中表现的并不明显,但是通过《古墓丽影:暗影》和《地铁:离去》的测试我们可以看到这样一个现象,开启实时光线追踪虽然都会损失帧率,但是RTX3080损失幅度要小于上一代的RTX2080TI。这自然是归功于Ampere架构的第二代RT CORE带来的光追性能提升

说完了光线追踪,下面该讲一下另一个DLSS了,也就是NVIDIA的深度学习抗锯齿。简单的来说呢,就是显卡会以一个较低分辨率去渲染,然后通过NVIDIA的AI算法进行拉伸达到标称分辨率去输出。这样无疑大幅提高性能,但也不可避免的带来一定的画质损失。具体效果如何我们继续来看 同样是来自《Deliver Us The Moon》,下面两张图,第一张是关闭DLSS,第二张是DLSS开到“性能”模式


是不是看不太出来?至少冷眼看上去没什么区别。接下来我们放大到200%再仔细看一下右下角桌子上的那盏灯。下面四张图从左上到右下分别对应《DeliverUs The Moon》中DLSS的几个级别,分别是“关闭”——“品质”——“均衡”——“性能”,DLSS的渲染分辨率依次降低。 灯光球上面的灯罩部分出现了区别。开启DLSS之后,不但损失了一些锐度,而且AI还会自行脑补上一些本不应该存在于那里的纹理,的确对画质造成了一定的损失。但不要忘记我们是在将原图放大至200%之后才发现这些细节,而在游戏过程我们不可能这样拿着放大镜去观察每一帧的画面

然而开启DLSS之后我们能够得到什么样的性能回报呢?

效果是惊人的。在开启最高等级RTX的情况下,DLSS的性能模式相对于关闭DLSS帧率提高了170%,接近于得到了三倍的帧率。相比于这样级别的性能提升,损失一些需要用放大镜才能找得到的画质是完全值得的

在《古墓丽影:暗影》与《地铁:离去》的测试中,虽然没有《Deliver Us The Moon》那样的夸张,但在高分辨率下开启DLSS无疑会大幅提升性能。值得注意的是《地铁:离去》的1080P开启DLSS没有任何效果,所以DLSS对于1080P这种分辨率是没有意义的

其他游戏测试


接下来是TUF GAMINGRTX3080与ROG STRIX RTX2080TI在一些非RTX/DLSS游戏中的对决 《战争机器5》1080P分辨率下受限于CPU,两者没能拉开距离。而随着分辨率的提升,差距拉大到接近30%
在《荒野大镖客2》中除1080P分辨率以外,两个更高分辨率都要领先2080TI 20个百分点以上

《全面战争:特洛伊》,4K分辨率下RTX3080相对于RTX2080TI提升超过了25%

《无主之地3》提升幅度随分辨率升高而升高,4K分辨率下领先幅度超过30%

《地平线:零之曙光》,领先幅度约为20%

在上面的游戏测试中我们可以看到一个共同特点,RTX3080对于RTX2080TI的领先优势都是随着分辨率的提高而增加的。这其中存在两方面的因素:第一是Ampere架构对于高分辨率的适配性高于Turing,另一个则是1080P分辨率下CPU在多数时间是帧率的瓶颈,不能够完全展现出显卡的性能所致
功耗与散热


关于TGP
相信大家都听说过TDP这个词,这个叫做设计热功耗。很多人误以为这就是设备真实功耗,其实这是不对的TDP 125W的的I9 10900K拿回去随随便便就可以跑到200W了 而TGP这个词可能对大家比较陌生,大家不要和TDP混为一谈。虽然只有一个字母之差但这个TGP是货真价实的整卡功耗NVIDIA 给RTX3080设定的TGP是320W。我们可以看到在3DMARK 压力测试的过程中,TUF GAMING RTX3080显卡的功耗基本都在320W上下徘徊,也进一步证明这个TGP是准确的

接下来我们看看这款和上一代猛禽相同规格的散热器表现如何。同样是来自3DMARK压力测试,为什么我喜欢使用3DMARK压力测试来测试温度与功耗而不是FURMARK? 原因在于显卡终究是用来玩游戏而不是用来虐待的,NVIDIA商也会针对FURMARK这种拷机程序进行针对性的“优化”,避免在这种拷机时候浪费过多的性能和电力。所以我们经常可以发现在FURMARK中GPU无法Boost到达他的最高频率,并且功耗也不能触及峰值。而3DMARK不同,作为市面上主流的显卡跑分软件,在显卡性能评判中占据了重要地位。厂商也乐于将显卡最好的状态发挥在3DMARK程序里,所以我们在3DMARK中将会看到真正的满性能显卡。所以我才会选择3DMARK压力测试


室温27度的情况下,整个测试过程基本维持在60~61度之间非常稳定,风扇也维持在1800RPM左右

虽然转速达到了1800RPM,但是噪音控制的非常出色。使用噪声仪贴脸测得噪音约为48分贝左右,距离1m左右已无法分辨CPU风扇声音还是显卡风扇的声音

总结


将上面的测试做一个汇总,在我测试的所有项目中2560*1440分辨率下,TUF GAMING RTX3080领先ROG STRIX RTX2080TI大约18.9%。4K分辨率下领先大约23% 有人说这个幅度是不是有点低啊?看我的测试数据的确不高。但有一点值得注意,我测试所采用的ROG STRIX RTX2080TI O11G是被称为猛禽的顶级非公版,本身就强于绝大多数的RTX2080TI。假如换成其他普通的RTX2080TI,根据猛禽的优势换算下来差不多RTX3080会领先25~30%,这会是一个比较合理的判断

RTX3080的RTX+DLSS终于可以实现我们从2018年开始的4K光追梦,我们终于可以在游戏中真实的体验光线追踪带来的优越体验而不是面对一张张的截图而兀自伤感

我们再回到TUF GAMING RTX3080这张显卡本身。在这张显卡上我们可以看到华硕想把TUFGAMING这个系列发扬光大的决心。在PCB的用料规格上甚至超越了上一代的ROG STRIX,每一颗元器件似乎都向玩家们表达着TUF GAMING同样是一个出色的产品系列。并且TUF GAMING系列并没有ROG那么高的身价,在性价比方面相信也是一个不错的选择


分类