友達!マルチGPUでの処理について質問です。私は 4 つの gpu を使用しており、以下のような 3 つの方法で単純な A^n + B^n の例を試しました。
シングル GPU
with tf.device('/gpu:0'): ....tf.matpow codes...
複数の GPU
with tf.device('/gpu:0'): ....tf.matpow codes... with tf.device('/gpu:1'): ....tf.matpow codes...
特定の GPU は指定されていません (おそらくすべての GPU が使用されていると思います)
....just tf.matpow codes...
これを試してみると、結果は理解できませんでした。結果は 1. 単一の GPU : 6.x 秒 2. 複数の GPU (2 つの GPU) : 2.x 秒 3. 特定の GPU が指定されていない (おそらく 4 つの GPU) : 4.x 秒
#2 が #3 よりも速い理由がわかりません。誰でも私を助けることができますか?
ありがとう。