近日來,關于NVIDIA的GeForce 9600GSO與ATI的Radeon HD 4650/70顯卡的文章我們已經陸續出過多篇了,幾乎每次NVIDIA或者ATI方面一有動作,我們就會隨之跟進一篇性能測試方面的文章。不過,對于NVIDIA和ATI的降價速度來說,我們的文章似乎還是跟不上他們的腳步。就在ATI剛剛普及了售價為499元的標準版HD4650之后僅僅幾天的時間里,NVIDIA方面也有廠商迅速跟進,下調了9600GSO價格,保持了原有優勢。
但對于消費者來說很多人不會去選擇縮水版的產品,畢竟價格差距不大的情況下,完整版保證了用料、功能、附件等方面的優勢,還是會受到很多消費者青睞的,下面就讓我們來看看9600GSO中一款一線大廠的產品吧——微星 N9600GSO-T2D384。與縮水版產品相比,N9600GSO-T2D384,顯存384MB,位寬192bit,工作頻率:550/1375/1400Mhz。而那些售價較低的9600GSO要么這些產品將顯存減半為192MB容量、又或者將顯存位寬縮減為128bit,總而言之,這些產品如果從嚴格意義上來說的話,并不能完完全全將他們稱之為9600GSO顯卡。
貴族G92走入平民,只為贏得市場占有率
◆ 曾經貴族的9600GSO
熟悉顯卡的讀者都知道,9600GSO其實就是曾經的8800GS,兩者在架構規格上完全一樣,只是名稱的不同,兩者都是基于NVIDIA G92架構的圖形核心,只不過相比8800GT,9600GSO(或者說當時的8800GS)去掉了一組流處理器單元和一組Rop單元,最后規格壓縮為96個流處理器單元和192bit的顯存位寬。
但是即便如此,G92優秀的架構依然保證了其強勁的性能,數量依然眾多的流處理器加上足夠的顯存位寬,讓8800GS的性能僅次于8800GT,成為當時中高端產品線中的熱選顯卡。
『9600GSO的架構,比9600GT減少了流處理器并降低了顯存位寬』
但所謂世事無常,市場競爭的激烈讓產品線的更迭速度加快,8800GS推出不久,9600GT就應運而生,隨后,由于市場定位的問題,GeForce 9600GSO也開始了它的征程。
96>320 從核心架構詳細闡述G92核心
傳統的GPU因為采用了分離式的架構,所以經常會出現數據分配問題,極大的影響了渲染效率。而DirectX 10中最大的改進便是引入了統一渲染架構(unified shader),所謂統一渲染架構,最容易的理解方式就是Shader著色單元不再分離。
正是DX10統一架構的出現,sp單元也就是流處理器成為了一個規格的重要衡量指標,因為流處理器是顯卡像素處理、頂點處理乃至幾何單元處理的關鍵。不過因為設計架構的不同,sp單元也不能完全等同,因為它們的處理能力并不相同。
對于RV730核心的HD4670和HD4650,當消費者聽到320個流處理器的時候,確實感到了數量眾多,而9600GSO僅有96個流處理器,但是性能測試卻表明,9600GSO的性能更強,這是怎么回事呢?首先便是因為架構的不同導致的流處理器處理能力不盡相同。
GeForce 9600GSO采用的GPU代號為G92,擁有6個SP處理器組,每個組內部有16sp處理器單元以及4個紋理定制處理單元和8個紋理拾取單元,因此整個9600GSO擁有96個sp單元和24個紋理定制單元和48個紋理拾取單元。
『NVIDIA sp單元組的內部架構』
從sp單元的內部角度說,G92也就是9600GSO采用完全標量的設計,顯卡內部會把向量代碼自動轉換成標量代碼,達到100%的運作效率,除了GPU中的其它因素例如帶寬、存取延遲會對構成一定的性能影響,sp單元本身不存在任何延遲性能的結構。
而基于RV770架構而來的RV730雖然是超標量架構,但ATI的架構模式是以SIMD陣列為基礎的,RV730包含8個SIMD陣列,每個SIMD陣列和每陣列的sp單元數量上相比RV770都有所壓縮,HD4670/HD4650包含8組SIMD陣列,每個SIMD陣列有8個sp單元,因此RV730 包含了64個sp單元。