科學(xué)計(jì)算顯卡的兩個(gè)主要性能指標(biāo):
1、CUDA compute capability,這是英偉達(dá)公司對(duì)顯卡計(jì)算能力的一個(gè)衡量指標(biāo);
2、FLOPS 每秒浮點(diǎn)運(yùn)算次數(shù),TFLOPS表示每秒萬億(10^12)次浮點(diǎn)計(jì)算;
另外,顯存大小也決定了實(shí)驗(yàn)中能夠使用的樣本數(shù)量和模型復(fù)雜度。
1、CUDA compute capability對(duì)比
GTX Titan x :5.2
GTX 980 :5.2
Tesla K80 :3.7
Tesla K40 :3.5
K4200 : 3.0
2、TFLOPS 比較
單精度single 雙精度double
GTX Titan x : 7 0.2
GTX 980 : 4.6 0.15
Tesla K80 : 8.74 2.91
Tesla K40 : 4.29 1.43
K4200 : 2.0
單精度能夠保證小數(shù)點(diǎn)后6到7位計(jì)算準(zhǔn)確(2^23),雙精度則是14到15位(2^52)
3、顯存大小
GTX Titan x :12Gb
GTX 980 :4Gb
Tesla K80 :24Gb
Tesla K40 :12Gb
K4200 :4Gb
4、價(jià)格比較(網(wǎng)上商城京東淘寶報(bào)價(jià))
GTX Titan x :8000+-
GTX 980 :6000+-
Tesla K80 :30000++
Tesla K40 :25000+-
K4200 :6000+-
總結(jié)
1、GTX 系列顯卡優(yōu)缺點(diǎn):
優(yōu)點(diǎn):?jiǎn)尉扔?jì)算能力強(qiáng)大,顯存最大12Gb,性價(jià)比高
缺點(diǎn):雙精度計(jì)算能力弱,沒有計(jì)算糾錯(cuò)ECC 內(nèi)存,對(duì)于超高精度計(jì)算不利
2、Tesla 或 quadro顯卡優(yōu)缺點(diǎn):
優(yōu)點(diǎn):雙精度計(jì)算能力最強(qiáng),擁有ECC內(nèi)存增強(qiáng)計(jì)算準(zhǔn)確率,
缺點(diǎn):?jiǎn)尉扔?jì)算能力差,價(jià)格較高
單從性能上選擇,Tesla K80是最強(qiáng)大的,但也最貴;綜合性價(jià)比來考慮 GTX Titan X 最好。 |