|
|
|
|
|
AMD: 基于X1900,AMD發布“流處理器”加速卡 |
|
作者:第三媒體
來源:www.TheThirdMedia.com
日期:2006-11-16
|
|
|
|
|
|
|
|
|
[摘要]
在今天的2006年超級計算機大會上,AMD發布了業界首款專用“流處理器”(Stream Processor),利用名為“Close To Metal”(CTM)的新式硬件界面,可滿足高性能計算(HPC)應用的硬件需求,帶來強大的浮點運算性能。
|
|
[正文]
在今天的2006年超級計算機大會上,AMD發布了業界首款專用“流處理器”(Stream Processor),利用名為“Close To Metal”(CTM)的新式硬件界面,可滿足高性能計算(HPC)應用的硬件需求,帶來強大的浮點運算性能。
聽起來這是個嶄新的概念,其實正是利用了旗下圖形產品部門(原ATi)的Radeon X1900顯卡(R580),也就是ATi之前提出的“流計算(通用計算)”概念。流計算來源于“大量并行處理器”,而X1900的48個獨立像素處理核心正符合這一需求。
軟件開發人員在數年前就發現,GPU不但可以渲染圖形,還能處理其他數據,尤其是在嚴重依賴計算的情況中。BionicFX就率先利用GeForce 6800進行音頻處理,斯坦福大學的Folding@Home研究項目也開始利用Radeon X1900實現分布式計算的加速。
當今最強大的超級計算機是IBM的藍色基因/L,擁有65536個雙核心處理器,也就是131072個處理核心,峰值運算性能367TFlops。如果換成AMD來打造這一系統,“流處理器”只需更少數量的處理器就能達到同樣的性能,而如果使用同樣數量的處理器,則將為系統帶來大幅的提速。利用Radeon X1900顯卡內蘊藏的巨大性能潛力,理論上只需不到1000個圖形處理器就能達到藍色基因/L的性能水平,因為每個擁有3.84億晶體管的GPU都能提供至少375GFlops的運算能力。而借助CTM界面,就可以“直接訪問(GPU的)原生指令集和內存”,提供8倍于傳統3D編程界面的性能。——根據AMD利用Radeon X1900 XTX進行的MatMult測試,基于CTM的性能為96GFlops,而基于OpenGL只有12GFlops。
與普通的X1900顯卡相比,流處理器加速卡加入了特殊的電路,配備1GB GDDR3內存,頻率1300MHz,內存控制器也經過調整,以優化流計算應用,同時擁有48個激活的像素處理器(每個內置兩個算術邏輯單元ALU、兩個標量ALU和一個分支執行單元),頻率600MHz,功耗165W。考慮到可能會在今后與AMD的協處理平臺Torrenza以及HyperTransport總線結合,流處理器加速卡仍然采用了PCI-E x16接口。該平臺現在還不支持CrossFire,不過AMD發言人Wil Wills表示,是否提供并行流處理器加速卡取決于服務器廠商。
AMD目前已經開始向銷售商出貨這種流計算加速設備,并提供企業級全套技術支持服務和三年有限質保。GraphStream Inc.、PANTA Systems、Rackable Systems、Clearspeed等硬件平臺供應商都將推出各自的流計算服務器,并有60多家企業和研究機構加入了AMD的這一項目。雖然本質上仍是塊X1900顯卡,但經過調整后的要價高達2600美元,是普通X1900顯卡的5倍多。
AMD的流計算概念現階段主要面向高性能計算領域,但AMD相信遲早也會走向消費級市場,用于圖像和視頻加速,尤其是H.264編碼。至于相應的流處理軟件,AMD希望能在未來2年內看到。 (2006-11-16)
|
|
【 頻道首頁 】【 評論
】 【 打印
】 【 字體:大
中
小
】
|
|
上一篇:計算機: Opteron擾動第28次超級計算機TOP500排行 下一篇:AMD: AMD為芯片組改名 ATi痕跡已經越來越少 |
|
導航:報價 | 大全 | 排行榜 | 產品大全 | 參量 | 訂閱 |
|
|