1新旗艦讓泰坦跌落神壇
今年被很多人認為是VR元年,醞釀了多年的VR終于呈現出井噴式增長;今年同樣是GPU的爆發之年,時隔5年,28nm的GPU終于退出歷史舞臺,全新的14/16nm制程開始大放光彩。隨著NVIDIA Pascal架構和AMD Polaris顯卡的大幅度曝光,GPU界仿佛過年一樣熱鬧,每天都有新消息,每周都有新曝光,真假莫辨的傳言點燃了DIY玩家心中追求更快更強顯卡的激情。終于,2016年5月7日,NVIDIA博得先機,率先發布了全球首款16nm游戲顯卡——GeForce GTX 1080/1070,正如老黃所說:“A New King”誕生,至此,GPU界展開了全新的篇章,1x nm級的AN顯卡大戰一觸即發。
NVIDIA GeForce GTX 1080產品綜述|圖片(1)|參數|報價|點評本地參考底價 5399.00元
在NVIDIA Editor's Day的發布會上,老黃自信地宣稱:“GeForce GTX 1080比GTX Titan X還快,甚至比雙路GTX 980 SLI還快!其VR性能是GTX Titan X的2倍,能耗比是GTX Titan X的3倍!”說完這席話,臺下爆發出雷鳴般的掌聲和歡呼聲,作為Pascal架構的首發先鋒,GTX 1080竟做到了戰勝上代Maxwell架構的所有卡,不得不讓人感嘆,新時代終于來了,GTX 1080締造了全新的性能神話。

GeForce GTX 1080
老黃在會上展示了一張GTX 1080運行游戲時的幀數對比圖,對比的對象是GTX 980,通過柱狀圖可以看出GTX 1080在游戲中的表現大約是GTX 980的1.7倍。就在昨天,筆者參加NVIDIA的媒體技術講解會,會上證實,GTX 1080的游戲性能的確是GTX 980的1.7倍,VR性能是GTX 980的2.7倍。如果算上SLI的效率,GTX 1080的確如老黃所說,比GTX 980雙路SLI要強一點,而根據推算,GTX 1080應該比GTX Titan X2強25-30%,這樣一看,提升的確很大。

GeForce GTX 1080
不過這些都是根據NVIDIA自己的跑分以及會議上的說明得出的結論,實際性能如何需要我們親自去證明。就在前不久,我們拿到了NVIDIA的公版GeForce GTX 1080,也就是老黃會上所稱的“Founders Edition”,同時,我們也得到了NVIDIA提供的測試驅動368.14,該驅動正是老黃在發布會上進行演示時所用的驅動。是時候揭曉GTX 1080的神秘面紗了,究竟它是否能夠如我們所期待和推測的那樣強悍,我們會用軟件和游戲一一去證明,來和我們一起,去見證泰坦的隕落,新一代卡皇的真容吧!

點擊圖片圍觀全球首臺GTX1080水冷主機
2似是故人的新架構
似是故人的新架構
GeForce GTX 1080采用了兩年前就已在GTC上被老黃透漏的全新架構——Pascal,“Pascal”依然取自一位著名物理學家的名字,國際單位制中壓力的單位“Pa”即以其姓氏命名。Pascal架構的第一款產品是4月初發布的Tesla P100,其采用GP100大核心,而這次發布的GTX 1080則是采用GP104核心,具體型號為GP104-400,次旗艦GTX 1070為GP104-200。GP104核心面積約為314平方毫米,得益于16nm的制程優勢,核心內集成了72億晶體管,是GTX 980晶體管數量的1.38倍,核心面積卻僅為GTX 980的78.9%。

NVIDIA GP104-400核心
基于Pascal架構的GM204-400芯片運算資源總量為2560個ALU,TFU數量為160個,后端的ROPs數量為64個,四個帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元,大小為8GB。同GTX 980相比,其各項參數均有所提升,尤其是顯存帶寬達到了320GB/s,這是因為其率先采用了GDDR5X顯存,GDDR5X顯存的改進使得GTX 1080在位寬相同的情況下擁有更高的帶寬,初期即可達到10-12Gbps,而隨著進一步的研發最高能夠提升到16Gbps。
| 顯 卡 規 格 比 較 表 |
| 顯卡型號 |
GTX 1080 |
R9 Fury X |
GTX 980 |
GTX Titan X |
| 首發限價 |
\$599 |
\$649 |
\$549 |
\$999 |
| GPU代號 |
GP104 |
Fiji XT |
GM204 |
GM200 |
| GPU工藝 |
16nm |
28nm |
28nm |
28nm |
| GPU晶體管 |
7.2B |
8.9B |
5.2B |
8B |
| 著色器數量 |
2560 |
4096 |
2048 |
3072 |
| 單精度浮點 |
9 T |
8.6 T |
5 T |
7 T |
| ROPs數量 |
64 |
64 |
64 |
96 |
| 紋理單元數量 |
160 |
256 |
128 |
192 |
| 核心頻率 |
1607MHz |
1050MHz |
1126MHz |
1000MHz |
| boost頻率 |
1733MHz |
1050MHz |
1216MHz |
1075MHz |
| 架構 |
Pascal |
GCN |
Maxwell |
Maxwell |
| 顯存頻率 |
2500 MHz |
500 MHz |
1753 MHz |
1753 MHz |
| 內存位寬 |
256 bit |
4096 bit |
256 bit |
384 bit |
| 內存帶寬 |
320 GB/s |
512 GB/s |
224 GB/s |
336 GB/s |
| 內存類型 |
GDDR5X |
HBM |
GDDR5 |
GDDR5 |
| 內存容量 |
8 GB |
4 GB |
4 GB |
12 GB |
注:表中售價均為官方首發限價
我們可以看到GeForce GTX 1080的默認核心頻率達到了驚人的1607MHz,Boost頻率為1733MHz,顯存帶寬為320GB/s,這款產品完整支持DirectX 12 API以及異步運算,在DX12中有著更好的表現。GTX 1080的默認Pixel Fillrate能力達到了102.8Gpiexls/S,默認Texture Fillrate能力為277.3Gtexels/S。憑借超高的基礎頻率和龐大的運算規模,GTX 1080擁有9 TFLOPS的超高單精度浮點運算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS單精度浮點運算能力,成為目前單精度浮點運算性能最高的游戲顯卡。

GP104架構圖
Pascal架構GP104-400芯片由以下主要的部分組成:
1、基于TSMC的16nm FinFET工藝。
2、4單元的宏觀并行結構,20組SMs單元被分為4個GPC,每個GPC包含5組SMs。
3、20組全新設計的,包含了幾何引擎、光柵化引擎以及線程仲裁管理機制的SMs單元。每個SMs單元包含一組負責處理幾何任務需求的PolyMorph Engine,同時均下轄5組更基本的SM單元,每個SMs單元包含8個負責處理材質以及特種運算任務如卷積、快速傅里葉變換等的Texture Array,四組并行的二級線程管理機制以及對應的shared+Unified Cache等緩沖體系。
4、GP 104擁有8個32位顯存控制器,總計256位,每個32位顯存控制器包含8個ROPs單元和256KB二級緩存,共計64個ROPs單元和2M二級緩存。
5、改進型的4.0版本PolyMorph Engine,包含了為VR設計的The Simultaneous Multi-Projection Engine,在極端情況下,SMP引擎可以減少32倍VR所需的幾何渲染工作量。

GP104 SM單元架構圖
在GeForce GTX 1080上,我們看到了其與上代基于Maxwell 2.0架構顯卡相類似的設計,主要區別就是每個GPC中多了一組SMs單元。這就讓這款顯卡能夠支持所有在GeForce GTX 900系列中的特性,以后使用到這款顯卡的玩家能夠獲得與其他采用基于Maxwell 2.0架構設計的顯卡的體驗。
3初次見面,GDDR5X顯存
初次見面,GDDR5X顯存
HBM顯存已經成為新一代高端顯卡的標準之一,而且此前JEDEC也正式公布了JESD235A的技術規范標準,帶來了TB/s級帶寬、16/32GB超大容量的HBM2顯存。不過HBM的問題在于顯存成本依然很高,不可能短時間內應用在全部顯卡上,因此GeForce GTX 1080使用了良品率更高,成本更低的GDDR5顯存的升級版——GDDR5X顯存。

GTX 1080上使用的GDDR5X顯存
GDDR5X則可以簡單理解為在GDDR5技術基礎上的一個拓展,其選擇采用雙管齊下的方式來提升顯存帶寬。首先,它的總線從DDR(雙倍數據倍率)升級到了QDR(四倍數據倍率)。

SDR、DDR及QDR的對比關系
需要說明的是,SDR(單倍數據倍率)即只利用時鐘信號的上沿來傳輸數據;而DDR(雙倍數據倍率)則同時利用了時鐘信號的上沿和下沿來傳輸數據,這意味著系統可以在同樣的時間內、同一時鐘頻率下將傳輸數據的速率提升一倍;而QDR(四倍數據倍率)則在DDR的基礎上,進一步提供獨立的寫入接口和讀取接口,以此達到四倍之于SDR的數據傳輸速率。

GDDR5X顯存顆粒
同時,GDDR5X還簡單粗暴的將數據預取位寬從8-Bit提升到了16-Bit,從而得到更高的帶寬,初期即可達到10-12Gbps,而隨著進一步的研發最高能夠提升到16Gbps。相比之下,GDDR5現在最高也才7Gbps,超頻到極限約為8Gbps。傳輸速率的提升再加上顯存位寬的提升,相當于在提高車速的基礎上又拓寬了車道數量,因此GDDR5X可以得到GDDR5兩倍的帶寬。

GDDR5X顯存特性
雖然從本質上說,GDDR5X同GDDR5相比沒有什么區別,但大幅提升的頻率還是帶來了可觀的帶寬提升。在HBM2顯存良率達標之前,至少在最近的一段時間內,NVIDIA和AMD必然還是以GDDR5X顯存為主。此外,鎂光已經宣稱GDDR5X顯存量產,這就給使用GDDR5X顯存的GTX 1080的產能有了一個保證,而AMD的全新Polaris顯卡應該也會用上GDDR5X顯存。
4顯卡全新技術解析
Simultaneous Multi-Projection技術
面對即將大爆發的VR市場,NVIDIA顯然要讓GPU承擔起更多任務,來協助建立VR生態圈。在GeForce GTX 1080/1070的發布會上,NVIDIA為旗下VR SDK——VRworks添加了新的內容。首先是Simultaneous Multi-Projection技術,該技術直譯為“同步多重投射”。

老黃講解Simultaneous Multi-Projection技術
經常組多聯屏的玩家一定知道,當屏幕組成一個小于180°的夾角,也就是兩塊顯示器之間形成角度的時候,顯卡渲染場景一直有個很難糾正的扭曲現象,就是看上去渲染的圖形依然看上去是一個180°平面的圖形,卻被硬生生地被放在兩塊形成夾角的顯示器上,看上去根本沒有任何的扭曲和形變。換句話說,雖然顯示端已經是曲面屏了,但是畫面還是180°的平面,比如左邊這幅圖:

Simultaneous Multi-Projection技術示意
可以看到對于右邊的部分GPU還是基于一個180°的平面渲染的,問題在于我們的顯示器擺放是有角度的,并且呈一個弧形,但是GPU并不知道顯示器之間的夾角會影響輸出的圖形,它只是機械的渲染,所以右邊這部分場景其實是渲染錯誤的,正確的輸出應該是如右圖這個樣子。Simultaneous Multi-Projection技術可以根據顯示器之間的角度,在生成圖像的同時動態調整圖像,將渲染的場景按照一定的角度生成,也就是讓生成的圖像保持有角度的渲染,而不只是機械地生成一張平面,換句話說,可以將本身是平面的畫面曲面化以貼合曲面的屏幕。
除了解決了這個尷尬角度的問題,Simultaneous Multi-Projection還針對VR渲染進行了特別的優化,并且引入了新的Single Pass Stereo技術,Single Pass Stereo可有效減少傳統VR渲染一半的工作量,上圖所示的這個場景,啟用Single Pass Stereo后幀率從60~70幀增加到90多幀,提升幅度超過30%,而90幀正是VR游戲的最低要求。

Single Pass Stereo技術
VRWorks Audio技術
VR主要是通過視覺來讓用戶擁有身臨其境的體驗,然而光有視覺是不夠的,想要獲得足夠的沉浸感,聽覺也是十分重要的一環。在會上,NVIDIA展示了一項有關VR聽覺的加強技術,名為VRWorks Audio,該技術是全球首款實時物理模型的聲學仿真技術。

老黃講解VRWorks Audio(圖片來自BenchLife)
有物理基礎的空間或3D音效,即虛擬場景內產生的音效,在到達用戶虛擬的耳朵之前會受到一定的影響,這一過程后才產生的。影響的因素可能包括:由于墻壁或門的封閉,使聲音呈現的靜音狀態;或者聲音在經過多個物理表明反射后產生的回音等。

《VR Funhouse》demo
NVIDIA提到,他們在做音頻模型或渲染的過程很像光線追蹤的過程,光線追蹤對處理器要求很高,但在渲染圖像上及其精確,它能夠計算出一個場景中從來源到目的地這一路徑上的每一束光線。NVIDIA宣稱可以追蹤聲波在虛擬場景內的路徑,并將根據扭曲的聲波來應用到其“物理”能力和經過渲染的音頻上。事實上,VRWorks Audio使用了NVIDIA現有的光線追蹤引擎OptiX來模擬在某一個環境內的聲音運動或其傳播軌跡,同時根據你所處的虛擬世界的大小、形狀和環境材質來實時改變該聲音。
Ansel截圖技術
NVIDIA發布了一個全新的截圖工具,工具的名稱叫做Ansel,該名稱是為了紀念偉大的攝影師Ansel Adams。說起這個攝影師,它還是很有名氣的,是自然風光攝影殿堂級人物,還曾獲得美國公民的最高褒獎——總統自由勛章。以Ansel的名字來命名新的截圖軟件,一來是為了紀念這位大師,二來是為了表明,截圖也可以是一種藝術。

Ansel截圖技術
憑借Ansel,游戲玩家能夠合成自己喜歡的游戲畫面,可以在游戲世界中的任何有利位置將鏡頭指向任意方向。游戲玩家最高能夠以32倍的屏幕分辨率捕捉屏幕截圖,然后即可在截圖上選擇某個位置放大顯示并做到不失真。憑借照片過濾器,游戲玩家可以實時添加特效,然后截取完美的照片。游戲玩家可以捕捉360度立體光球圖像,以便在虛擬現實頭戴式顯示器或谷歌Cardboard中進行觀看。

老黃講解Ansel
沒聽懂?通俗點講,就是你可以在游戲中截取一個超大的截圖,這個截圖是360°環繞式的,這個截圖包含了所有角度和位置信息,你可以在任意一點觀看在該點的游戲圖像。截好了圖你就可以在VR眼鏡中查看了,看到的效果就如同身處在游戲中。聽起來很酷炫是不是?這個截圖不僅能體現在VR顯示器上,還能通過APP傳遞給手機,通過手機也能直觀的感受到這張游戲截圖的震撼性。并且這項技術并非空談,《全境封鎖》、《見證者》、《巫師3》、《無人深空》、《虛幻競技場2014》在現場都宣布將支持Ansel技術。

已經有許多大作宣布支持Ansel
5顯卡改進技術解析
第四代delta色彩壓縮技術
顯存壓縮技術對于提高顯卡性能是很有幫助的。同之前的NVIDIA GPU一樣,全新的GTX 1080也采用了這樣一種無損壓縮技術。這種技術有以下幾點好處:減少顯存數據寫入量;減少數據從顯存到GPU二級緩存的數據傳輸量,有效增加了GPU二級緩存的容量以及降低紋理單元和幀緩存間的數據傳輸量。

第四代delta色彩壓縮技術
顯存壓縮技術中最重要的一種就是“delta色彩壓縮技術”,這種技術讓GPU計算每一個塊中像素的差異,然后將相同色彩的像素信息進行壓縮,在極端狀況下,壓縮儲存后的參考像素還不及未經壓縮像素一半的大小,這無疑大大減小了數據傳輸量。

GTX 1080有效帶寬可達GTX 980的1.7倍
GTX 1080搭載了全新的增強型delta色彩壓縮技術,可以更高效地實現2:1的壓縮比,同時,全新的4:1、8:1高壓縮比模式也已被GTX 1080所采用,這使得顯存利用率再次達到一個新高度,相當于等效提升了對應比例的顯存帶寬。第四代delta色彩壓縮技術同上代相比能夠減少20%的有效帶寬,再配合上GTX 1080率先使用的10Gbps速率的GDDR5X顯存,最終使得其有效顯存帶寬是上代GTX 980的1.7倍。
異步運算技術
從傳統角度上看,GPU主要承擔的任務是圖形渲染,系統會將待處理的工作按照指定流程傳遞給GPU,以便讓圖像能夠以正確的順序顯示出來,這點對于圖形渲染來說非常重要。而現如今隨著GPU功能的不斷挖掘以及架構的不斷升級,許多計算、復制的工作也會交由GPU來做,如果仍然只有一條序列的話,渲染、計算、復制三項任務將會互相搶占,造成“交通擁堵”,運行效率自然大打折扣。因此多條序列分別處理渲染、計算、復制等工作才能大大提升GPU效率,這種技術就是異步運算技術。
說起異步運算技術,大家可能會首先想到AMD的GCN架構,GCN的異步著色器技術讓GCN架構的A卡在DX12中擁有了出色的性能表現。隨著DX12時代的全面到來,NVIDIA的全新GTX 1080自然也是在異步運算上狠下功夫。官方宣稱,GTX 1080有著完全的異構計算能力,借助異構著色器,GPU可以并行處理多任務,而非按優先級進行候選或者搶占。

動態負載平衡技術
首先為大家介紹的是Pascal架構引入的全新技術——動態負載平衡。為了讓大家能夠更直觀地了解這項技術,我們看上面這張圖:橫坐標是時間,縱坐標是GPU資源分配百分比,淺綠色是圖形工作量,深綠色部分是計算工作量,而灰色斜紋部分為空閑。首先看上半部分的靜態平衡,如果計算工作量所需的時間比圖形工作量的時間長,而兩個工作需要同時完成才能進行新的工作,那么進行圖形工作的GPU就會有一部分閑置出來,這就浪費了GPU的性能;接著我們看下圖的動態平衡,當計算工作量先完成時,負責計算工作的GPU資源就會去幫助完成剩余的圖形工作,這樣就不會有閑置的GPU資源,并且大大降低了工作所需的時間,這就是Pascal的動態負載平衡技術。

Pascal架構的搶占技術
然后是有關GPU搶占的技術。了解VR的朋友們一定聽說過“異步時間扭曲”技術,異步時間扭曲是指在一個線程(稱為ATW線程)中進行處理,這個線程和渲染線程平行運行(異步),在每次同步之前,ATW線程根據渲染線程的最后一幀生成一個新的幀。(有關異步時間扭曲的知識請參見《小菜硬件雜談 說說VR里的異步時間扭曲》)實現異步時間扭曲需要GPU支持合理的搶占粒度,那么搶占指的是什么意思呢?所謂搶占,就是指為了使重要工作得以快速運行,GPU會選擇性關閉不太重要的工作,從而提高重要工作的運行效率。Pascal架構是史上首個支持像素級搶占的GPU架構,當接收搶占請求時,Pascal的圖形單元會記錄下那些優先級較低的工作被中斷時的位置,優先處理那些重要的工作;當搶占結束后,其余的工作從之前被中斷的位置開始繼續執行。

搶占在VR中的應用——異步時間扭曲(ATW)技術
Pascal的搶占不僅作用于圖形工作中,在計算工作中也可以實現。線程級的搶占和像素級搶占的實現方式類似,都是停下當前優先級較低的線程塊的工作,去支援優先級較高的SMs運算線程,當搶占結束后,從之前中斷的地方開始繼續計算工作。對于游戲來說,像素級搶占和線程級搶占相結合讓Pascal架構GPU可以以極快的速度和最小的性能開銷實現搶占,同時對于CUDA計算任務,Pascal也可以以最好的搶占粒度去實現搶占。
Fast Sync技術
Fast Sync是一種替代傳統垂直同步的防止畫面撕裂的技術。同V-Sync不同的是,開啟Fast Sync后,在做到防止畫面撕裂的同時能夠不降低顯卡的性能,也就是說Fast Sync能夠實現V-Sync開啟時的流暢畫面,并且有著如同未開啟V-Sync一樣的低延遲。從下圖可以看出,Fast Sync的延遲僅比關閉V-Sync時的延遲多了8ms,這點差距還是十分令人滿意的。最后,Fast Sync技術可以搭配G-Sync技術一起使用,為玩家帶來更好的視覺效果。

Fast Sync和V-Sync延遲對比
全新高帶寬橋接器
同GTX 1080問世的還有NVIDIA全新設計的SLI橋接器。使用傳統的橋接器進行雙卡互聯時只需要連接每張卡上的一根SLI金手指即可,而這種全新的橋接器需要同時連接GTX 1080上的兩根SLI金手指,以提高GPU之間的數據傳輸帶寬。這個全新的SLI橋接器叫做“New SLI HB Bridge”,使用這個全新的橋接器時,GTX 1080的SLI接口運行在650MHz,而傳統的橋接器搭配之前的GPU只能運行在400MHz。

New SLI HB Bridge
GTX 1080的全新SLI系統能夠提供上代GPU SLI系統2倍的帶寬,這對于4K或5K這樣的高分辨率及環繞輸出尤為重要。而且全新的橋接器可以實現更平滑的畫面輸出,在游戲中能夠為玩家帶來更順暢的游戲體驗。不過遺憾的是,由于全新的橋接器需要使用兩根SLI金手指才能工作,因此使用New SLI HB Bridge的GTX 1080只能實現雙卡SLI。
GPU Boost 3.0
GPU Boost是NVIDIA推出的GPU動態提速技術,能夠在TDP允許的范圍內,盡可能地提高GPU運行頻率,進而提升GPU工作效率。全新的GTX 1080為我們帶來了這個技術的最新升級版——GPU Boost 3.0。GPU Boost 3.0可以設置各個電壓點的頻率偏移。GPU Boost 2.0及以前的版本只能實現固定的頻率偏移,也就是說頻率的提升只能呈線性的方式,提升后的頻率無法達到此電壓下對應的最大頻率。

GPU Boost 2.0與3.0之間的區別
GPU Boost 3.0就很好地解決了這個問題,頻率偏移可以對應到單個電壓點,而不是像之前的線性相關,這樣就可以使得GPU的頻率達到該電壓下所能實現的最大值,大大提升了GPU Boost的效果。全新的GPU Boost 3.0還能與超頻軟件相結合,讓玩家可以手動調整頻率偏移曲線,來達到理想的GPU頻率。
6顯卡拆解賞析
顯卡拆解賞析
首先我們來看一下GeForce GTX 1080的拆解賞析:

顯卡正面

均熱板及渦輪扇

顯卡散熱器

散熱器背面

顯卡背板

顯卡信仰燈

顯卡PCB

顯卡核心

輔助供電接口

視頻接口

Founders Edition包裝盒
接下來我們看一下同GeForce GTX 980的對比拆解,圖中上方為GeForce GTX 1080,下方為GeForce GTX 980:

顯卡正面對比

顯卡背面對比

顯卡側面對比

散熱模塊對比

PCB正面對比

PCB背面對比

供電接口對比
同GTX 980相比,GTX 1080的有以下幾點設計上的改進:散熱器經過全新的設計,這點已經無需贅言;供電由4+1相升級為5+1相,輔助供電接口由雙6pin變為單8pin,為濾波網絡增添了額外的電容,優化供電網絡;最后,背板經過全新的設計,分為兩段式,在SLI時,可以卸下后半部分的背板,以防止背板對氣流的干擾。
7測試平臺環境一覽
測試平臺硬件環境一覽
為保證測試能夠發揮顯卡的最佳性能,本次測試平臺采用最強酷睿芯——Intel酷睿i7-5960X處理器、技嘉X99芯片組主板、影馳 Gamer DDR4-2400 8GB 四通道內存、安鈦克1200w金牌電源組建而成。詳細硬件規格如下表所示:
| 測 試 平 臺 軟 硬 件 配 置 |
| 核心配件 |
| CPU |
Intel |
酷睿i7-5960X |
| 主板 |
技嘉 |
GA-X99-Gaming G1 WIFI |
| 核芯顯卡 |
無 |
無 |
| 內存 |
影馳 |
Gamer DDR4-2400 8GB x4 |
| 硬盤 |
浦科特 |
PX-512M6S+ |
| 電源 |
安鈦克 |
HPC-1200 |
| 系統及驅動程序 |
| 操作系統 |
Microsoft Windows 10 |
| 主板驅動 |
Intel芯片組驅動 |
| 顯卡驅動 |
NVIDIA GeForce Game Ready Driver(368.39 WHQL) |
| DirectX環境 |
DirectX 11 |
| 幀數監控 |
Fraps 3.5.1 or Benchmark |

測試用主板:技嘉GA-X99-Gaming G1 WIFI

測試用內存:影馳 GAMER DDR4-2400 8GB*4(玩家主場 電競內存)
測試用固態硬盤:浦科特 PX-512M6S+
測試平臺軟件環境一覽
為保證系統平臺具有最佳穩定性,本次產品測試所使用的操作系統為Microsoft Windows 10正版授權產品,除關閉自動休眠外,其余設置均保持默認,詳細軟件環境如下表所示。
|
測 試 平 臺 軟 件 環 境 |
|
操作系統 |
Microsoft Windows 10 專業版 |
|
(64bit / 版本號:10240) |
|
主板芯片組驅動 |
Intel Chipset Device Software |
|
(WHQL / 版本號:9.2.3.1022) |
|
顯卡驅動 |
NVIDIA GeForce Game Ready Driver |
|
(版本號:368.39 WHQL) |
|
桌面環境 |
Microsoft Windows 10 專業版 |
|
(2560×1600 / 32bit / 60Hz) |
在測試成績方面,理論性能測試用得分來衡量性能,數值越高越好;游戲性能測試用游戲自帶Benchmark及游戲中平均幀數來衡量性能,數值同樣越高越好。
8理論性能測試:3DMark 11
理論性能測試:3DMark 11
在進行游戲測試之前,自然是要用權威的軟件來看看新卡的實力,首先是有資歷的3DMark 11。3DMark 11使用原生DirectX 11引擎,包含四個圖形測試項目,一項物理測試和一組綜合性測試,并提供了Demo演示模式。該測試程序使用了Bullet物理引擎,使用原生DirectX 11引擎,在測試場景中應用了包括Tessellation曲面細分、Compute Shader以及多線程在內的大量DX11新特性。

3DMARK 11

3DMARK 11 GPU成績
從3DMark 11的測試當中GeForce GTX 1080彰顯出了GP104核心的強大實力,沒有任何目前已知的單芯顯卡產品能夠超越其性能,其得分大約是GTX Titan X的1.25倍,是GTX 980的1.72倍,性能的確如老黃所言。
9理論性能測試:3DMark FireStrike
理論性能測試:3DMark FireStrike
于北京時間2013年2月5日推出的新3DMark,采用全新界面設計,除了測試分數,還會展現每個場景測試期間的實時曲線,全程記錄幀率、CPU溫度、GPU溫度、CPU功耗。新3DMark取消了傳統的E、P、X模式,取而代之的是根據負載不同所推出的三個場景,其中FireStrike專為基于DirectX 11顯卡搭建的高端游戲平臺,而CloudGate則支持基于DirectX 10環境的主流硬件,IceStorm則支持入門級DirectX 9設備、手機、平板電腦等等。

3DMark FireStrike

3DMark FireStrike GPU成績
在3DMark FireStrike測試中,GTX 1080依舊是“秒全家”的節奏,其得分是GTX Titan X的1.24倍,是GTX 980的1.66倍。至于同其他顯卡的比較,我們覺得已經沒有什么意義,哪怕是雙芯的R9 295x2依舊無法與之匹敵,唯一能戰勝GTX 1080的顯卡只有AMD雙芯旗艦Radeon Pro Duo。
10游戲性能測試:《古墓麗影9》
游戲性能測試:《古墓麗影9》
《古墓麗影9》是由Crystal Dynamics開發,Square Enix負責發行的跨平臺系列動作游戲,2013年3月開始發售。本作聚焦于勞拉年輕的時期,摒棄了前幾作女超人的設定,玩家可以在游戲中看到更真實的勞拉年輕時代形象。由于引擎的升級,本作相比之前的作品會有更優秀的畫面,是《古墓麗影》系列最具變革性的一作。

《古墓麗影9》

《古墓麗影9》1080p平均幀數

《古墓麗影9》2K平均幀數
《古墓麗影9》是一個比較老的游戲了,之所以拿出這個游戲作為測試項目,是因為《古墓麗影9》對顯卡的要求不算太高,在1080p分辨率下一張甜點級顯卡就可以完美運行,而甜點級顯卡恰恰是絕大多數用戶所擁有的。在《古墓麗影9》的測試中,GTX 1080呈現出了壓倒性的優勢,在1080p分辨率下領先GTX Titan X 30余幀,而在2K分辨率下領先GTX Titan X 20余幀,是當之無愧的性能之王。
11游戲性能測試:《全境封鎖》
游戲性能測試:《全境封鎖》
《全境封鎖》是一款開放世界第三人稱射擊角色扮演大型多人在線網絡游戲。游戲設定在瘟疫爆發后的美國,玩家作為“全境封鎖”計劃的部隊,在“黑色星期五”后的美國尋找一線生機。該作的大背景同《輻射》系列很類似,都是描繪大災難后的世界,玩家需要在這個混亂的世界中尋找一線生機,可以說生存是玩家唯一的選擇。

《湯姆克蘭西:全境封鎖》

《湯姆克蘭西:全境封鎖》1080p平均幀數

《湯姆克蘭西:全境封鎖》2K平均幀數
測試完甜點級顯卡可駕馭的游戲,我們來測試一下次旗艦級顯卡才能夠應對的《全境封鎖》。該游戲的官方推薦顯卡是GTX 970/R9 390,而在2K分辨率下的推薦顯卡為GTX 980Ti。可以看到,無論是常規分辨率還是2K分辨率,GTX 1080都可以完美應對,其成績遙遙領先其余各卡,即使在2K分辨率下也可以達到78幀的超高幀數。
12游戲性能測試:《巫師3:狂獵》
游戲性能測試:《巫師3:狂獵》
《巫師3:狂獵》采用Redengine3引擎,作為一款次世代的RPG游戲作品,本作栩栩如生的真實環境還原以及全新角色面部動作和人物面部表情都成為了一大亮點。Redengine3引擎在支持各種全新圖形技術的同時也加快了地圖載入速度,經由無縫地圖打造的宏大世界讓玩家可以自由無限制的漫游在游戲世界當中。

《巫師3:狂獵》

《巫師3:狂獵》1080p平均幀數

《巫師3:狂獵》2K平均幀數
最后我們來測試一下素有顯卡殺手之稱的《巫師3》。作為一款真正意義上的次世代游戲《巫師3:狂獵》對硬件有著極高的要求,只有旗艦級顯卡才能在1080p分辨率下特效全開達到絕對流暢的60幀,而即便是上代的頂級旗艦也無法在2K分辨率下達到絕對流暢的60幀。通過測試我們可以看出,在2K分辨率下,GTX 1080依舊能夠達到70幀左右的成績,在1080p分辨率下更是超過了90幀,實力有目共睹。
13DX12性能測試:《奇點灰燼》
DX12性能測試:《奇點灰燼》
《奇點灰燼》是一款Stardock制作的即時戰略游戲。該作采用Oxide Games的Nitrous引擎打造,背景設定在遙遠的未來,那時人類完全以意識形態存在,人們已經掌握了上帝一樣的力量。但是人類發現自己已經處于戰爭之中,敵人就是一個叫做“Haalee”的具有意識形態的AI,企圖推翻人類在宇宙之中的統治地位。

《奇點灰燼》

《奇點灰燼》1080p平均幀數

《奇點灰燼》2K平均幀數
《奇點灰燼》是全球首款DX12游戲,其自帶的benchmark對游戲DX12性能有著很好的考量。在DX12測試中,GTX 1080依舊遙遙領先,在1080p分辨率High畫質下,平均幀數達到了88幀,而在2K分辨率Extreme畫質下,幀數依舊達到了65幀,強悍的性能讓人無話可說。
144K性能測試
4K性能測試
測試完相對常規的1080p和2K分辨率,接下來看看GTX 1080在4K分辨率下的表現,測試結果如下:

GTX 1080 4K分辨率下游戲平均幀數
在GTX 1080之前,沒有任何一款顯卡可以在4K分辨率下特效全開流暢運行游戲,而通過上面5項游戲測試可以看出,有4項游戲達到了流暢所需的45幀,而上面三款開銷相對較小的游戲甚至可以實現完美運行,由此可見,GTX 1080即使面對4K超高畫質也是毫不畏懼。
15網游性能測試
網游性能測試
測試完典型的單機大作,我們來看看在網游中GTX 1080的表現。由于GTX 1080有著超越旗艦級顯卡的性能,因此我們選擇的游戲是對顯卡有著一定要求的《風暴英雄》和《魔獸世界》,而沒有選擇諸如LOL、CF等對顯卡性能要求并不是很高的游戲,GTX 1080在不同分辨率下的表現如下:

《魔獸世界》

《風暴英雄》不同分辨率下幀數表現

《魔獸世界》不同分辨率下幀數表現
通過以上網游測試可以看出,即使在4K超高分辨率下,GTX 1080依舊可以跑到100幀以上的幀數,運行起來毫無壓力。
16VR性能測試
VR性能測試
在VR測試部分,我們選擇了Steam平臺推出的一款名為“SteamVR Performance Test”的軟件程序,該程序可以全面檢測用戶的PC性能,考驗PC是否能夠支持VR設備穩定流暢運行。SteamVR效能測試會透過一段2分鐘由Valve制作的《光圈科技機械人維修VR展示》來評估玩家電腦的渲染力。在收集相關數據后,它將判斷玩家所使用的系統能否維持在90fps的幀率運作以及VR內容的視覺保真能否夠校調至建議的水平標準。

《SteamVR Performance Test》

《SteamVR Performance Test》測試結果

GTX 1080與GTX 980保真度對比
雖然在VR測試中GTX 1080的保真度同GTX Titan X沒有拉開差距,但區別還是很明顯的:GTX 1080的保真度呈現出一條完美的直線,沒有絲毫振動,而且已測試幀數達到了15000幀以上,GTX Titan X僅僅達到了12000幀,單就已測試幀數看,GTX 1080超過GTX Titan X 25%左右,而同上代的GTX 980相比,無論是幀數還是保真度都遙遙領先。

Single Pass Stereo技術
根據老黃在發布會上所說,得益于Single Pass Stereo技術,GTX 1080有著兩倍于GTX Titan X的VR性能,而由于時間緊迫,我們這次進行VR測試只是簡單地考量了GTX 1080在VR應用中的實際表現,并沒有幀數的對比測試,在之后的VR專項測試中,我們會為大家帶來有關GTX 1080的詳細VR性能測試。
17顯卡功耗及溫度測試
顯卡功耗及溫度測試
對于游戲顯卡來說,功耗和溫度仍舊是我們參考的必要數據,因為這些數據聽起來好像是和性價比沒什么關心,但它作為輔助屬性密切影響玩家的實際游戲體驗,更高的功耗會帶來更多噪音和溫度,因此我們應該全角度評價產品,而不是僅僅通過性能和價格。
溫度方面我們將繼續采用Furmark來進行測試,考慮到不同游戲之中,顯卡的負載率不同,尤其是低分辨率和高分辨率的負載率差異會讓顯卡的功耗完全無法測算平均數值。因此我們需要采用Furmark這樣的權威性烤機軟件,讓GPU芯片之中每一個運算單元完全滿載,充分發揮供電最大化的狀態才能得出準確的成績。

顯卡烤機溫度為82℃
功耗方面我們則是采用Furamrk拷機,讓顯卡達到滿載狀態,然后拍攝功耗儀實時功耗。我們將參數設定為1280*1024分辨率,開啟8*MSAA,最終GTX 1080以最高滿載溫度82℃的情況下完成測試,頻率穩定在1.7GHz左右。在溫度較低時,在GPU boost 3.0的作用下,顯卡頻率一度飆升至1870MHz,當溫度上升到溫度墻82℃是,顯卡穩定在官方所述的boost頻率上。散熱器在滿載時,轉速也穩定在50%,也就是2000轉左右,在這個轉速下的噪音還是可以接受的。

顯卡待機平臺功耗為58.7W(不包括顯示器)

顯卡滿載平臺功耗為270W(不包括顯示器)
得益于Pascal架構的高能耗比,顯卡待機時的平臺功耗很低,只有58.7w,而顯卡滿載時,平臺的總功耗也不過270w,基本符合官方給出的180w的TDP。
18新卡皇開啟16nm新時代
新卡皇開啟16nm新時代
GeForce GTX 1080的測試至此已經結束,其性能及各項特性相信各位看官應該都有所認知了。從數據上看,基于Pascal架構的新一代NVIDIA旗艦級顯卡在絕對性能上已經完全超越了MAXWELL旗艦GTX Titan X,提升幅度約25%;而從功耗上看,GTX 1080的功耗僅為180w,是GTX Titan X的72%,也就是說GTX 1080的能耗比是GTX Titan X的1.74倍!

而且大家都知道,GTX 1080只是Pascal架構的第一款游戲顯卡產品,其有著相對較大的功耗余量和工程設計余量。GTX 1080的CUDA處理器數量只有2560個,而完整的GP100核心的CUDA處理器數量為3840個,也就是說GP104-400核心照比GP100大核心閹割掉了1/3的CUDA處理器,閹割幅度同之前的GTX 980之于GTX Titan X相同。功耗上亦是,根據以往經驗,NVIDIA單芯頂級旗艦的TDP一般是250w左右,而GTX 1080還沒有AMD R9 300系列甜點級顯卡的功耗高。我們知道的是,GTX Titan X有著GTX 980約1.3倍的性能,如果未來新泰坦使用的是GP100大核心,那么其至少也會有GTX 1080 1.3倍以上的性能。就目前測試結果看,GTX 1080已經實現了完勝整個MAXWELL家族,那么之后的新泰坦和GTX 1080Ti必將會讓顯卡性能達到一個更高的高度。

得益于16nm制程和Pascal架構的高效,所有基于全新Pascal架構的公版產品都將會擁有遠勝于過去的功耗表現,而非公版產品則擁有了更大的發揮空間和可利用余量。Pascal架構顯卡最讓人驚奇的地方就在于頻率達到了前所未有的新高度,公版GTX 1080的默認頻率已經高達1.6GHz,而根據之前外媒的曝光,有些非公版顯卡甚至默認頻率會超過2GHz!而在2GHz下的GTX 1080的3DMark FireStrike Extreme得分突破了12000,將AMD的雙芯旗艦Radeon Pro Duo也踩在腳下。可以預見,基于Pascal的非公版顯卡的性能將會比過去更為瘋狂,瘋狂到難以想象。所以無論是常規的游戲用戶,還是關注硬件可玩性和絕對性能的傳統DIY玩家,GTX 1000系列顯卡一定不會讓你失望。

為什么這一次NVIDIA會讓全新的產品線實現如此大的性能進步?誠然,制程的升級和架構的改進必然會帶來性能的飛躍,可這種飛躍似乎與老黃以往的“利益至上”原則不太相符,一塊準旗艦就把MAXWELL全家都秒了,誰還會去花8000元買塊Titan X而不花5000元買塊性能更強的GTX 1080?這不是要加速MAXWELL的停產么?原因其實大家可以猜到,那就是NVIDIA一家獨大的舒坦日子可能要到頭了,對手AMD要奮起直追了。

隨著NVIDIA將顯卡制程從28nm升級至16nm,老對手AMD也將制程升級到更低的14nm,這下AMD和NVIDIA又一次站在相同的起跑線上了。根據此前的報道,AMD主打中端的Polaris 10在實際測試中以更低的功耗完勝GeForce GTX 950,可見AMD也開始走高能耗比的路線了。為了在全新的1Xnm制程上占據主導地位,NVIDIA不得不放一個大招給AMD一個下馬威,而GTX 1080正是代表了NVIDIA必勝的決心。筆者我十分期待未來精彩的AN大戰,是NVIDIA繼續穩坐全球第一的寶座,還是AMD收復失地實現反殺,只有時間能告訴我們答案。

除性能外,價格也是眾多玩家所關心的地方,GTX 1080的建議零售價為4599元,Founders Edition的價格為5399元。看起來老黃還算是良心,建議零售價比GTX 980Ti的首發限價還便宜了100元。不過這個直譯過來叫做“創始人版”的版本讓很多人摸不著頭腦,怎么以前從來沒聽說過這個版本?其實Founders Edition就是之前的Reference Edition,也就是公版。根據NVIDIA官方說法,Founders Edition相比此前的公版做工更加細致,包括采用全新設計的均熱板和鋁合金外殼等,性能和散熱比之前更加理想,因此價格上則更貴一些。此外,Founders Edition照比之前的公版有著更長的壽命,玩家可以在很長一段時間內買到這個信仰滿點的版本,而之前的公版只有在首發后的一段時間內買到。

A New King
這次的GTX 1080除了在性能上做到了一覽眾山小,給了玩家們足夠大的驚喜,其搭載的各項技術也體現了NVIDIA追求卓越,以用戶為本的精神,全新的截圖技術Ansel、讓顯示更真實的同步多重投射、讓虛擬更現實的VR Works Audio,這所有的技術都表明,NVIDIA的確是全球視覺計算技術的行業領袖。NVIDIA仍舊在正確的技術進步的道路上不斷努力,一點點地增加著自己的技術儲備并推進技術前沿,用技術去改變世界,讓這個世界變得更加美好。
19NVIDIA GeForce GTX 1080詳細參數