不久前NVIDIA正式宣布了最新版并行計算開發工具CUDA 6,相比此前的CUDA 5.5有著非常大的進步。NVIDIA官方表示CUDA 6可以讓并行編程前所未有的輕松,能夠顯著節省開發人員的時間和精力,而通過GPU加速可帶來最多8倍于CPU模式的性能提升。主要包括統一尋址(Unified Memory),替換庫(Drop-in Libraries),多GPU支持(Multi-GPU Scaling)三個方面。
1、統一尋址(Unified Memory):
可直接訪問CPU內存、GPU顯存,無需在彼此之間手動拷貝數據,可在大量編程語言中更簡單地添加GPU加速支持。
其實CUDA 4就開始支持統一虛擬尋址,x86 CPU、GPU內存池可在同一空間內進行尋址,但那僅僅是簡單的內存管理,擺脫不了手動數據轉移。
2、替換庫(Drop-in Libraries):
簡單地用GPU加速庫替換已有的CPU庫,BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。
3、多GPU支持(Multi-GPU Scaling):
重新設計的BLAS、FFT GPU庫,單個節點可自動支持最多八顆GPU,雙精度浮點性能可超過9TFlops,并且支持最多512GB的更大負載。
此外,CUDA 6平臺還會提供一整套的編程工具、GPU加速數學庫、文檔和編程指導。
CUDA 6目前只是紙面宣布,2014年初才會開放下載。有需要的可注冊加入CUDA-GPU開發者項目。
(第三媒體 2013年11月18日)