nvidia tesla k20 價格優(yōu)惠, 整機方案,GPU高性能運算服務(wù)器
不同的計算類型決定了GPU的架構(gòu)更加適合通用計算
另外一種不同類型的計算問題——并行計算,卻一直局限在大型服務(wù)器集群和超型計算機領(lǐng)域。標準CPU架構(gòu)的特長是管理多個離散的任務(wù),但是有些任務(wù)能夠被細分為多個更小的單位并且可以被并行化,CPU在處理這些任務(wù)的時候并沒有突出的性能優(yōu)勢,但這恰恰就正好是適合GPU解決的問題類型。
對于快速、廉價的解決這一類問題,GPU有著相當大的潛力可以發(fā)揮。GPU計算可以使得PC和工作站具有超級計算的能力,并且可以擴展服務(wù)器集群的處理范圍,以解決先前CPU集群不能處理的問題。
GPU計算的目標是充分利用GPU先天的巨大計算能力,以解決在高性能計算領(lǐng)域內(nèi)許多相當困難但很重要的問題。
GPU的浮點運算能力和CPU不在一個數(shù)量級
在剛剛過去的幾年中,圖形處理單元已經(jīng)發(fā)展為具有強勁馬力的計算設(shè)備。由于具有多達128個的處理單元以及相當高的存儲帶寬,為GPU提供了多到令人難以置信的計算資源,在圖形或非圖形處理中都是如此。
上圖的結(jié)果主要是由于GPU在架構(gòu)上就是為計算密集型處理而設(shè)計,高強度并行計算—這本身也是圖像渲染的需要。因此在GPU中,更多的晶體管被用于數(shù)據(jù)處理而不是數(shù)據(jù)存儲與流控制。
GPU特別適合處理那些可以具有較高算法強度且可以被被表達為并行數(shù)據(jù)計算的問題,換句話說,同樣的程序如果通過細分成眾多數(shù)據(jù)元素的并行執(zhí)行,會具有較高的算術(shù)操作與存儲操作之比。
CPU的處理方式是使用一個單獨的程序順序的循環(huán)處理數(shù)據(jù),GPU則是進行數(shù)據(jù)的并行處理,它把數(shù)據(jù)元素映射、規(guī)劃為數(shù)以千計的并行處理線程。很多應(yīng)用程序都有一個較大的數(shù)據(jù)集,就可以通過數(shù)據(jù)并行編程模式來加速他們的執(zhí)行。這些應(yīng)用程序包括:
·地震模擬
·計算生物學
·選擇商業(yè)風險計算
·醫(yī)學成像
·模式識別
·信號處理
·物理仿真
NVIDIA Tesla:GPU計算解決方案
NVIDIA提供了一套完整的GPU計算產(chǎn)品線,包括系統(tǒng)產(chǎn)品和全新的開發(fā)環(huán)境。產(chǎn)品線的中心是基于GeForce 8系列架構(gòu)的GPU,以及CUDA開發(fā)工具包和C編譯器。
G80特殊的緩存式架構(gòu)進一步提高了ALU浮點運算效能
·NVIDIA Tesla GPU將給PC和工作站帶來更高計算性能;
·NVIDIA Tesla GPU 桌面超級計算機配合標準工作站可以提供令人難以置信的高強度計算性能;
·NVIDIA Tesla GPU 在一個1U形式的裝置內(nèi)集成了高密度的GPU核心;
·NVIDIA CUDA開發(fā)環(huán)境包含了快速傅氏變換、BLAS 算法。
·NVIDIA 軟件開發(fā)包提供了文檔以及編程樣例。
NVIDIA計算解決方案設(shè)計上與現(xiàn)行的IT基礎(chǔ)結(jié)構(gòu)做到了無縫銜接,遵守下列的工業(yè)標準:
· C 編譯器,提供一個為令人熟悉的、支持度很好的開發(fā)環(huán)境
· 支持獨立128bit的IEEE 754單精度浮點單元,和CPU浮點單元一樣支持各種高級的浮點操作。
· 可以兼容于Intel/AMD的x86 32-bit和64-bit微處理器架構(gòu)以及Microsoft or Linux 的操作系統(tǒng)。
NVIDIA CUDA GPU計算軟件
NVIDIA CUDA技術(shù)基于一種全新的用于開拓GPU運算性能的軟件架構(gòu),CUDA程序執(zhí)行時,GPU作為主CPU的協(xié)處理器工作,GPU可以處理大量的并行信息,同時CPU組織、解釋、與后臺交流要處理的信息。應(yīng)用程序的計算密集型部分要被執(zhí)行很多次,每次由主應(yīng)用程序提交的不同數(shù)據(jù),經(jīng)過編譯后由GPU并行執(zhí)行。