幾十年來(lái),計(jì)算機(jī)CPU芯片一直按照摩爾定律飛速發(fā)展,每隔十八個(gè)月,單位芯片面積上的晶體管數(shù)量就增加一倍,性能提高一倍。由于物理極限的限制,單純依靠制造工藝的提升已經(jīng)無(wú)法滿(mǎn)足計(jì)算需求,X86傳統(tǒng)計(jì)算平臺(tái)陷入了技術(shù)發(fā)展的瓶頸。內(nèi)存延時(shí)長(zhǎng)、頻率低導(dǎo)致緩存面積越來(lái)越大,邏輯控制越來(lái)越復(fù)雜。緩存消耗了70%以上的芯片面積,同時(shí)也消耗了70%以上的電能,真正有效的運(yùn)算部件面積比重很小。芯片上的晶體管密度越來(lái)越大,使得單位面積上功耗持續(xù)增加,散熱問(wèn)題日益嚴(yán)重。
由于CPU的性能提升并不是無(wú)止境的,這也就催生出計(jì)算技術(shù)向多樣化發(fā)展,而不僅僅依賴(lài)于傳統(tǒng)的計(jì)算平臺(tái)。當(dāng)計(jì)算技術(shù)進(jìn)一步細(xì)化,GPU作為一種獨(dú)立的計(jì)算單元,以其優(yōu)異的運(yùn)算性能脫穎而出,為計(jì)算技術(shù)的革新帶來(lái)了一種新的思路。
GPU計(jì)算是指利用圖形卡來(lái)進(jìn)行一般意義上的計(jì)算,而不是傳統(tǒng)意義上的圖形繪制。時(shí)至今日,GPU已發(fā)展成為一種高度并行化、多線(xiàn)程、多核的處理器,具有杰出的計(jì)算功率和極高的存儲(chǔ)器帶寬。
GPU計(jì)算得到了業(yè)界的廣泛支持,NVIDIA、AMD、INTEL等都對(duì)芯片市場(chǎng)的微妙變化和GPU計(jì)算的技術(shù)發(fā)展前景都極為關(guān)注,并展開(kāi)了激烈的技術(shù)競(jìng)賽。
GPU計(jì)算方案配置選擇,主要考慮以下因素:
1. 計(jì)算比例,通常應(yīng)用程序的執(zhí)行需要GPU與CPU協(xié)同完成,可根據(jù)GPU計(jì)算部分所占比重,配置節(jié)點(diǎn)GPU卡密度;
2. 計(jì)算規(guī)模,根據(jù)不同應(yīng)用數(shù)據(jù)規(guī)模及計(jì)算類(lèi)型,可以選擇單機(jī)單GPU卡、單機(jī)多GPU卡和GPU集群應(yīng)用模式;
3. 數(shù)據(jù)通信,在GPU集群模式下,可根據(jù)應(yīng)用程序?qū)和ㄐ艓捈把舆t的需求,選擇高速I(mǎi)nfiniband網(wǎng)絡(luò)或萬(wàn)兆網(wǎng)絡(luò);
4. 存儲(chǔ)系統(tǒng):?jiǎn)喂?jié)點(diǎn)應(yīng)用模式下一般數(shù)據(jù)量比較小,對(duì)存儲(chǔ)系統(tǒng)性能要求不高,一般采用本地存儲(chǔ);集群環(huán)境下,應(yīng)用數(shù)據(jù)量比較大,一般配置大容量、統(tǒng)一、高速的并行文件系統(tǒng),另外對(duì)一些特殊應(yīng)用,如石油、天然氣應(yīng)用,可以在每個(gè)GPU計(jì)算節(jié)點(diǎn)內(nèi)部配置SSD硬盤(pán),作為分級(jí)存儲(chǔ)使用,加速節(jié)點(diǎn)內(nèi)部數(shù)據(jù)交換;
5. 管理調(diào)度,合理選擇GPU集群的作業(yè)調(diào)度和監(jiān)控系統(tǒng),可以提升集群的使用效率,降低維護(hù)成本。 |