1

別の GPU (Tesla K-20、cuda 7.5 をインストール、6GB メモリ) でコードを実行すると、次のエラーが発生します (スタックトレースを参照)。GeForce 1080 または Titan X GPU で実行すると、コードは正常に動作します。

スタックトレース:

File "code/source/main.py", line 68, in <module>
    train.train_epochs(train_batches, dev_batches, args.epochs)
  File "/gpfs/home/g/e/geniiexe/BigRed2/code/source/train.py", line 34, in train_epochs
    losses = self.train(train_batches, dev_batches, (epoch + 1))
  File "/gpfs/home/g/e/geniiexe/BigRed2/code/source/train.py", line 76, in train
    self.optimizer.step()
  File "/gpfs/home/g/e/geniiexe/BigRed2/anaconda3/lib/python3.5/site-packages/torch/optim/adam.py", line 70, in step
    bias_correction1 = 1 - beta1 ** state['step']
OverflowError: (34, 'Numerical result out of range')

では、GeForce または Titan X GPU では正常に動作しているのに、別の GPU (Tesla K-20) でこのようなエラーが発生する理由は何でしょうか? さらに、エラーは何を意味しますか?そうは思わないメモリオーバーフローに関連していますか。

4

2 に答える 2