GeFroceのGPUアップグレード検討
せっかくなので、メモですが記事として残します。
現在、MSI GTX 960 2GD5T OCV2 (GeForce GTX960 2GB OC) を利用しております。
2GBのメモリ容量となります。2万5千円で購入しました。
ディープラーニング(Deep Learning)深層学習、ニューラルネットワーク(ディープニューラルネットワーク、Deep Neural Network: DNN)による機械学習向けにGeForceのアップグレードを検討。
- YOLO, DarknetなどDNN実施時のGPUメモリ不足(out of memory)回避、メモリ不足回避の学習回数増加による学習時間増加
- 画像関係のDNNでは、GPUメモリ不足により、満足に学習自体実行が出来ないケースあり
- 趣味の範囲なので、過剰な投資は出来ない(個人的には2−3万円以内)
- PCで基本的にゲームなどは実施しない、モニタもHDMI接続1台
- メモリ容量が増えるが目的
グラフィックカードのメーカーですが、NVIDIAかAMDとなり、それぞれNVIDIAからGeForce、AMDからRadeonがリリースされています。
各種ツールとの親和性を考えると、GeForce一択となりました。(自身でコンパイル時の修正などが出来るスキルが有るならば、魅力的なRadeonもありと思います)
NVIDIAのGeForce RTX 20XXシリーズ(2080 Ti、2080、2070、2060)やGeForce GTX 16XXシリーズ(1660 Ti、1660)が現行モデルとなります。
予算オーバーのRTX20シリーズですが、深層学習用のテンソルコア(Tensor Core)搭載となります。4×4行列の積和算を4つ並列に行う事が出来るようになり、Tensor Coreを使えば、CNNの畳み込み高速化、メモリ転送の効率化などにより、前世代の Pascal GPU と比べて、学習(トレーニング)速度が4 倍になるようです。
Volta Tensor コア GPU が AI パフォーマンスの新記録を達成
消費電力も、現在のパソコンケースの電源サイズや電気料金にも影響するので、一応比較軸に入れます。消費電力とTDP:Thermal Design Power(熱設計電力)は混同されて利用されています。TDPは、電源および冷却に関する指標を示す数字となります。
NVIDIAのGPUコアは「CUDA(クーダ)コア」と呼ばれます。一般的には「シェイダープロセッサ(Shader Processor)」、「ストリームプロセッサ(Stream Processor)」などと呼びます。
GPU導入候補比較表
価格帯を考え、メモリサイズ6GB導入で検討しました。
メモリサイズ2GB部分のみが、(現在利用している)GTX960の弱点で、非常にコストパフォーマンスが良い機種であると再確認も出来ました。
GPU | GeForce GTX 960 | GeForce RTX 2060 | GeForce GTX1660Ti | GeForce GTX1660 | GeForce GTX1060 |
価格イメージ 2019/08 | 当時購入金額 25,000 | 42,000 | 36,000 | 28,000 | 26,000 |
メモリサイズ | 2GB | 6GB | 6GB | 6GB | 6GB |
メモリ規格 | GDDR5 | GDDR6 | GDDR6 | GDDDR5 | GDDR5 |
CUDA(SP数) | 1024 | 1920 | 1536 | 1408 | 1280 |
消費電力 | 120W | 160W | 120W | 130W | 120W |
サイズ | 230 x 111 x 38 | 175x126x43 mm | 178x126x41 mm | 178x126x41 mm | 175x115x38 mm |
個人深層学習向けGPU比較結果
- 価格的にGTX1660(現行モデル)とGTX1060を最終的に検討。価格差も誤差の範囲であり、GTX1660が購入の最有力候補
- 私は、予算外なのですが、想定以上に価格がやすかったので、あえて明記。
予算的に可能ならば、GeForce RTX 2060が絶対におすすめです。