14

Ubuntu に TensorFlow をインストールするときに、CUDA で GPU を使用したいと考えています。

しかし、私は公式チュートリアルのこのステップで停止しています:

ここに画像の説明を入力

これは正確にはどこ./configureですか?または、ソース ツリーのルートはどこですか。

私の TensorFlow は here にあります/usr/local/lib/python2.7/dist-packages/tensorflow。しかし、まだ見つかりませんでし./configureた。

編集

Salvador Dali's answer./configureに従って見つけました。しかし、サンプルコードを実行すると、次のエラーが発生しました。

>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
I tensorflow/core/common_runtime/local_device.cc:25] Local device intra op parallelism threads: 8
E tensorflow/stream_executor/cuda/cuda_driver.cc:466] failed call to cuInit: CUDA_ERROR_NO_DEVICE
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:86] kernel driver does not appear to be running on this host (cliu-ubuntu): /proc/driver/nvidia/version does not exist
I tensorflow/core/common_runtime/gpu/gpu_init.cc:112] DMA: 
I tensorflow/core/common_runtime/local_session.cc:45] Local session inter op parallelism threads: 8

cuda デバイスが見つかりません。

答え

GPU サポートを有効にする方法についての回答は、こちら を参照してください

4

4 に答える 4

7

これは、あると思われるbashスクリプトです

ソースツリーのルート

レポをクローンしたとき。ここにあります https://github.com/tensorflow/tensorflow/blob/master/configure

于 2015-11-11T20:21:23.277 に答える
3
  • 最初の質問への回答:回答here./configureに従って既に見つかりました。ここに示すように、のソースフォルダーの下にあります。tensorflow

  • 2 番目の質問への回答:

実際、私は GPU を持っていますNVIDIA Corporation GK208GLM [Quadro K610M]CUDA+もcuDNNインストールしています。(したがって、次の回答は、正しいバージョンで正しくインストールされていることに基づいていCUDA 7.0+ます。)ただし、問題は次のとおりです。ドライバーをインストールしましたが、GPUが機能していません。cuDNN次の手順で動作するようにしました。

最初に、私はこれlspciをして得ました:

01:00.0 VGA compatible controller: NVIDIA Corporation GK208GLM [Quadro K610M] (rev ff)

ここでのステ​​ータスはrev ffです。それから、私はやりましたsudo update-pciids、そしてもう一度チェックlspciして、得ました:

01:00.0 VGA compatible controller: NVIDIA Corporation GK208GLM [Quadro K610M] (rev a1)

現在、Nvidia GPU のステータスはrev a1として正しいです。しかし現在、tensorflowはまだ GPU をサポートしていません。次の手順は次のとおりです (インストールした Nvidia ドライバーのバージョンは ですnvidia-352)。

sudo modprobe nvidia_352
sudo modprobe nvidia_352_uvm

ドライバーを正しいモードに追加するため。再び確かめる:

cliu@cliu-ubuntu:~$ lspci -vnn | grep -i VGA -A 12
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation GK208GLM [Quadro K610M] [10de:12b9] (rev a1) (prog-if 00 [VGA controller])
    Subsystem: Hewlett-Packard Company Device [103c:1909]
    Flags: bus master, fast devsel, latency 0, IRQ 16
    Memory at cb000000 (32-bit, non-prefetchable) [size=16M]
    Memory at 50000000 (64-bit, prefetchable) [size=256M]
    Memory at 60000000 (64-bit, prefetchable) [size=32M]
    I/O ports at 5000 [size=128]
    Expansion ROM at cc000000 [disabled] [size=512K]
    Capabilities: <access denied>
    Kernel driver in use: nvidia
cliu@cliu-ubuntu:~$ lsmod | grep nvidia
nvidia_uvm             77824  0 
nvidia               8646656  1 nvidia_uvm
drm                   348160  7 i915,drm_kms_helper,nvidia

Kernel driver in use: nvidiaが表示さnvidiaれ、正しいモードになっていることがわかります。

ここで、GPU をテストするために次の例を使用します。

cliu@cliu-ubuntu:~$ python
Python 2.7.9 (default, Apr  2 2015, 15:33:21) 
[GCC 4.9.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import tensorflow as tf
>>> a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')
>>> b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')
>>> c = tf.matmul(a, b)
>>> sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))
I tensorflow/core/common_runtime/local_device.cc:25] Local device intra op parallelism threads: 8
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:888] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_init.cc:88] Found device 0 with properties: 
name: Quadro K610M
major: 3 minor: 5 memoryClockRate (GHz) 0.954
pciBusID 0000:01:00.0
Total memory: 1023.81MiB
Free memory: 1007.66MiB
I tensorflow/core/common_runtime/gpu/gpu_init.cc:112] DMA: 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:122] 0:   Y 
I tensorflow/core/common_runtime/gpu/gpu_device.cc:643] Creating TensorFlow device (/gpu:0) -> (device: 0, name: Quadro K610M, pci bus id: 0000:01:00.0)
I tensorflow/core/common_runtime/gpu/gpu_region_allocator.cc:47] Setting region size to 846897152
I tensorflow/core/common_runtime/local_session.cc:45] Local session inter op parallelism threads: 8
Device mapping:
/job:localhost/replica:0/task:0/gpu:0 -> device: 0, name: Quadro K610M, pci bus id: 0000:01:00.0
I tensorflow/core/common_runtime/local_session.cc:107] Device mapping:
/job:localhost/replica:0/task:0/gpu:0 -> device: 0, name: Quadro K610M, pci bus id: 0000:01:00.0

>>> print sess.run(c)
b: /job:localhost/replica:0/task:0/gpu:0
I tensorflow/core/common_runtime/simple_placer.cc:289] b: /job:localhost/replica:0/task:0/gpu:0
a: /job:localhost/replica:0/task:0/gpu:0
I tensorflow/core/common_runtime/simple_placer.cc:289] a: /job:localhost/replica:0/task:0/gpu:0
MatMul: /job:localhost/replica:0/task:0/gpu:0
I tensorflow/core/common_runtime/simple_placer.cc:289] MatMul: /job:localhost/replica:0/task:0/gpu:0
[[ 22.  28.]
 [ 49.  64.]]

ご覧のとおり、GPU が使用されています。

于 2016-03-18T16:39:04.560 に答える
2

2 番目の質問: 互換性のある GPU (NVIDIA コンピューティング機能 3.5 以上) がインストールされていますか? また、指示に従って CUDA 7.0 + cuDNN がインストールされていますか? これが、失敗が見られる最も可能性の高い理由です。答えが「はい」の場合、cuda のインストールの問題である可能性があります。nvidia-smi を実行すると、GPU がリストに表示されますか? そうでない場合は、まずそれを修正する必要があります。これには、新しいドライバーの入手や nvidia-xconfig の再実行などが必要になる場合があります。

于 2015-11-12T00:45:13.093 に答える
0

7.0 cuda ライブラリと 6.5 cudnn ライブラリがある場合にのみ、ソースから GPU バージョンを再構築できます。これはGoogleによって更新される必要があると思います

于 2015-11-15T20:47:54.747 に答える