40系顯卡首批7199元起!賽博朋克2077幀數(shù)x4,老黃:大部分像素都是AI預(yù)測而非計算
老黃再現(xiàn)精準(zhǔn)刀法為30系清庫存保駕護(hù)航
夢晨 Pine 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
礦難來襲、玩家盤算何時下山之際,老黃帶著他的40系顯卡來了!
首發(fā)三款高端型號,RTX4090 24GB、RTX4080 16GB和12GB顯存兩版。
話不多說,直接上規(guī)格:
三款游戲幀數(shù)測試,在4K分辨率、全高設(shè)置、開啟光追與DLSS情況下,4090提高到上代旗艦3090Ti的2-4倍,4080與3080Ti對比也提高到原來的2-3倍。
來看一組實機(jī)畫面對比,來自《微軟模擬飛行》。
另外英偉達(dá)還與波蘭蠢驢合作,給《賽博朋克2077》開發(fā)了“全極致光線追蹤模式”,軟硬協(xié)作榨干所有性能,幀數(shù)直接x4。
要達(dá)成這些效果,靠的是全新GPU在制程工藝、硬件架構(gòu)、軟件算法上的一系列改進(jìn)。
臺積電工藝、DLSS3放大招
全新架構(gòu)Ada Lovelace,切換到臺積電4N定制工藝(5nm),專為生產(chǎn)GPU優(yōu)化的那種,而Ampere時代用的還是三星8nm。
新工藝加持下,RTX4090塞進(jìn)了760億個晶體管、1.8萬個CUDA核心,比上一代增加70%。
同時與上一代架構(gòu)Ampere對比,能效比也有較大提升。
一個重頭戲是DLSS3,這一次AI能力不僅用于超分辨率,還會用于插幀。
老黃說,以后你看到的游戲畫面中大部分像素都不是直接渲染出來的,而是AI預(yù)測的。
接下來,英偉達(dá)把新架構(gòu)下的SM多單元流處理器、負(fù)責(zé)AI計算的Tensor Core與負(fù)責(zé)光追的RT Core都升級至新一代。
SM多單元流處理器方面,最大的更新是“Shader執(zhí)行重排列”技術(shù)(Shader Execution Reordering)。
老黃講到,光追吃性能的主要原因是GPU內(nèi)部高度并行化、擅長做大量重復(fù)性高的工作。而光追場合下光線不斷反射與全場景內(nèi)不同材質(zhì)交互并不能發(fā)揮GPU優(yōu)勢。
這項技術(shù)負(fù)責(zé)動態(tài)調(diào)度工作負(fù)載、合理安排計算資源,能給光追帶來2-3倍性能提升,光追之外的綜合游戲性能也提升25%左右。
這是與CPU亂序執(zhí)行同等重要的計算革新。
張量核心Tensor Core,用了數(shù)據(jù)中心GPU H100的同款,新增FP8精度數(shù)據(jù)格式支持,吞吐量增加5倍。
光線追蹤核心RT Core方面, ray-triangle交叉吞吐量提高兩倍以上,還新增了Opacity Micromap引擎專攻樹葉、粒子和柵欄這種光線通過縫隙的場景。
總的看下來,新顯卡架構(gòu)主要性能提升都是圍繞光追,還有那么多不支持光追的老游戲怎么辦?
為解決這個問題,英偉達(dá)推出游戲MOD開發(fā)工具RTX Remix。
一邊玩游戲一邊打開它,就能直接從GPU渲染指令里攔截游戲的圖形資產(chǎn),包括幾何建模、材質(zhì)、燈光、攝像機(jī)位置等。
在AI輔助下給這些資產(chǎn)增加細(xì)節(jié)、超分辨率、增加物理性質(zhì)、添加光追和DLSS支持都不在話下。
還能一鍵打包成MOD發(fā)布,讓老游戲也能煥發(fā)第二春,比如讓20年前的《上古卷軸·晨風(fēng)》畫質(zhì)超過最新的《上古卷軸·天際》。
英偉達(dá)官方為經(jīng)典解謎游戲《傳送門》制作了光追MOD,將以免費DLC的形式稍后發(fā)布。
全在討好玩家,除了價格
相較于RTX30系列,40系列顯卡的性能增強(qiáng)夠有誠意了,那么價格如何呢?
直接來看黃老板給出的價格:
RTX 4090定價1599美元
RTX 4080(16GB)定價1199美元
RTX 4080(12GB)定價899美元。
在國內(nèi),目前給出的售價是:
RTX 4090 12999元起
RTX 4080(16GB)9499元
RTX 4080(12GB)7199元。
為了方便比較,也順便把之前國內(nèi)RTX30系列的官方售價擺上來:
RTX 3090 11999元
RTX 3080 5499元
RTX 3070 3799元
從給出的定價來看,90系列的變化幅度并不是很大,國內(nèi)售價在原來的基礎(chǔ)上漲了一點,算得上是“高性價比”(但這價格依舊是普通網(wǎng)友可望不可及)。
對比之下,80系列新出的兩款顯卡漲價就比較明顯,RTX 4080(16GB)相較于3080漲價近50%,被外界認(rèn)為是對標(biāo)RTX 3070的RTX 4080(12GB)也漲了近50%。
網(wǎng)友直呼:這根本沒想讓我們買40啊。
(看來黃老板飽受礦難其害,不知道手里還有多少30系顯卡)
不過游戲發(fā)燒友們也可以再等等。
在得知英偉達(dá)要發(fā)布40系列顯卡后,AMD也坐不住了,后腳就透露消息稱:11月3日會發(fā)布RX 7000系列顯卡。
并且還放出了一張性能對比圖,稱其性價比高,能效好。
值得一提的是,雖然這次RTX40系列相較于30系列性能翻倍,但功耗方面卻沒有很大的漲幅。
RTX 4090功耗正如之前傳言一樣為450W與3090Ti持平,RTX 4080(16GB)為340W,RTX 4080(12GB)為285W.
對于RTX4090,英偉達(dá)建議使用850W的電源,12GB的RTX 4080需要700W的電源,16GB需要750W的電源。
不僅如此,英偉達(dá)此次還升級了散熱系統(tǒng),進(jìn)一步優(yōu)化了雙軸流通系統(tǒng),將風(fēng)扇尺寸和翅片體積增加了10% ,并升級為23相電源。
(這尺寸倒是越來越大了)
甚至有網(wǎng)友調(diào)侃稱:
除此之外,大家的AI導(dǎo)師李沐也第一時間給出了自己的看法。
4090相比3090Ti,AI訓(xùn)練來說重要的參數(shù)都沒增強(qiáng),增強(qiáng)多卡并行的NVlink還給砍了,不如再等等4090Ti。
這次的40系新卡,你沖嗎?
參考鏈接:
[1]https://www.nvidia.cn/geforce/graphics-cards/40-series/
[2]https://www.youtube.com/watch?v=Uo8rs5YfIYY




