NVIDIA和駿兆電子公司于8月中下旬開始推動“1216超標量狂潮”活動,12條“超標量”流水的GeForce 6800 PCI-E和16條“超標量”流水線的GeForce 6800GT PCI-E顯卡正在引導一起高端應用的“質價比”的新消費觀念。當技術價值的走向,與“頻率至上”徹底決裂之后,核心架構的“效率至上”和為用戶帶來新應用和利益的“應用品質至上”成為當今產品最終極價值判定標準。基于此兩種價值標準,NVIDIA在GeForce6開始采用全新具有極大創造力的“超標量”核心架構,該架構可以在較低工作頻率下獲得其它架構更高的性能,非NVIDIA“超標量”核心架構設計的圖形卡,必須要硬性提高自身的頻率才能達到NVIDIA較低頻率下獲得的性能表現,如果按照全新的管線(流水線)產品市場定位規則,在相同流水線數量的情況下,以“性能分數/MHZ”的標準來標識NVIDIA的GeForce 6系列顯卡的話,顯而易見,GeForce 6的“超標量”核心架構帶來的效率是最高的,也就是說:其每MHZ的頻率下所獲得的性能分數遠遠拋離非NVIDIA核心的圖形卡。這就是為什么說“超標量”的效率是產品的核心價值之一,不過,今天,談“超標量”GPU架構可能對大多數人而言,不太直觀便于理解,畢竟這是NVIDIA架構師的事業,對于普通用戶而言,那涉及太艱深的探索。我們就來了解,“1216超標量狂潮”除了帶來了高效率核心GPU,也同時為用戶帶來了實實在在可以體驗到的最富價值的全新應用,這些應用全是NVIDIA公司發布GeForce 6系列產品才能提供支持特效品質應用,當然,也包括GeForce6800 PCI-E和GeForce 6800GT PCI-E顯卡在內。
當年的Riva128讓我們認識了NVIDIA,而后的TNT系列更是告訴業界3dfx不是3D游戲的唯一,其后的Geforce系列將3dfx趕下神壇并最終奠定霸主地位。毫無疑問,NVIDIA的發展之路可謂一帆風順。然而如日中天的NVIDIA還遠沒有到“一覽眾山小”的境界,ATI的緊追不舍使其如坐針氈。不過NVIDIA還是始終保持技術上的領先,如今SM3.0、HDR和SLI已經成為其統治業界的三大利器。
突破畫質極限——Shader Model 3.0
速度上的過分追求已經使玩家對3D游戲失去了興趣,因此畫質越來越得到業界的重視。繼Pixel Shader與Vertex Shader出現之后,整個游戲市場發生了翻天覆地的變化,如今DirectX 9.0C已經成為一種潮流。從目前的3D游戲發展趨勢來看,Pixel Shader與Vertex Shader正體現出越來越大的作用,以《寂靜嶺III》以及《波斯王子時子砂》為代表的部分游戲甚至指定要求顯卡具備Pixel Shader單元才能運行。然而不得不承認,無論是GeForce FX5950U還是Radeon 9800XT,其Shader單元的性能還在初級階段,一定程度上限制了應用與最終效果。
著色器(Shader)是渲染像素和頂點的小程序,分為像素著色器和頂點著色器兩種類型。這些程序能夠向基本的幾何圖形添加效果,例如,向藍色紋理平面添加水紋使其具有反射效果,也可向多邊形紋理添加玻璃效果使其具有透明的視覺特性。現在游戲畫面的品質要比三四年前好許多,著色器的作用功不可沒。
GeForce 6在核心設計時就將Shader部分作為重點,其整個體系架構可以分為三大塊,分別是Vertex Shader(頂點著色器)、Pixel Shader(像素著色器)和ROP(像素結果輸出處理器)。GeForce 6800GT擁有6組Vertex Shader、16組Pixel Shader和16組ROP。通過ShaderMake 2.0測試軟件對比,GeForce 6800 Ultra在這一部分的性能提升令人驚訝,這也注定Pixel Shader與Vertex Shader將會在未來的各種3D游戲中進一步普及。
Shader Model 3.0架構的GF 6800在分裂細胞中有著出色表現
不僅僅是Shader Model體系架構的提升,NVIDIA還升級了Pixel Shader的版本,從2.0躍遷到3.0。客觀來說,在目前的游戲引擎中,Pixel Shader 3.0與Pixel Shader 2.0起到提升性能和畫質的目的。事實上Pixel Shader3.0對于游戲編程人員的意義更大,它支持無限代碼長度的程序處理,提供新的分支指令,能夠輕松調用子程序,讓編程更為輕松,效率提升顯著,這對程序員來講是一大喜事。
在某些情況下,終止一個程序和開始另一個程序的開銷,降低了游戲的速度并使得這種效果的應用變得不切實際。由于不再強迫將每個像素著色器程序壓縮到96條指令中,因此程序員現在可以從硬件限制中解脫出來,可以在像素級別執行更復雜的效果。當著色器程序不再有長度限制時,復雜效果可以編寫成能夠榨取游戲平臺的所有性能。即使較長的程序的處理時間比較短程序的更長,但是CineFX 3.0引擎具有的技術和速度確保較長的程序依然可以運行如飛。同時,Shader Model 3.0支持動態程序流控制,額外的循環/分支選項和新的子程序調用/返回功能給與程序員更多的選擇,以開發出更有效率的著色器程序。Shader Model 3.0完全支持子程序、循環和分支、包含循環計數寄存器和條件碼以及一個新的back/face寄存器,給與了程序員完整的控制能力。沒有了長度的限制,再加上增強的程序流控制,Shader Model 3.0給予程序員空前的自由度,可以為游戲世界釋放出全新畫質與速度的創造力。