“cudnn”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

590 参照

theano - Theano が Gpu を見つけられない - Ubuntu 16.04

警告 (theano.sandbox.cuda): CUDA がインストールされていますが、デバイス gpu が利用できません (エラー: cuda を利用できません)

サンプル Theano プログラムを実行しようとすると、このエラーが発生します。

このスレッドで提案されているすべての修正を試しました。

nvcc --version出力：

nvcc: NVIDIA (R) Cuda コンパイラドライバ
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015 Cuda
コンパイルツール、リリース 7.5、V7.5.17

nvidia-smi出力：

gcc バージョン:

私はこれをしばらくの間機能させようとしてきましたが、誰かが私を正しい方向に向けてほしいと思っています。

2016-12-10T06:51:30.523

0 投票する

0 に答える

1640 参照

amazon-ec2 - g2.2xlarge インスタンスに CUDA 8.0 および Tensorflow 0.12 を含む cuDNN 5.1.5 をインストールできない

私が取った手順は以下のとおりです。ステップ中に、./configure(必要に応じて) v5.1.5 を指定する代わりに cuDNN バージョン (v5) のシステムデフォルトを許可しない限り、cuDNN の環境バージョン (v5) がターゲットバージョンと一致しないというエラーが表示されます。 (5.1.5)。Nvidia から CUDA 8.0 用の cuDNN v5.1.5 ファイルをダウンロードしたので、困惑しています。

さらに、https://github.com/tensorflow/tensorflow/blob/master/third_party/gpus/cuda_configure.bzlの 240 行目あたりを掘り下げた後、bazel configure スクリプトがチェックするバージョンは、 cuDNN バージョンのメジャー数字を考慮に入れます (cudnn.h 内のメジャー、マイナー、パッチの数字はそれぞれ 5、1、5 です)。したがって、どのようにしてバージョン 5.1.5 をインストールできるようになるかはわかりません。多分私はそれを間違って見ていますか？

いずれにせよ、g2.2xlarge インスタンスに CUDA 8.0 と Tensorflow 0.12 を使用して cuDNN 5.1.5 をインストールする方法はありますか?

ありがとう！

手順

（注：これらは機能しますが、必要に応じて5.1.5ではなく、cuDNN 5.0をインストールします）

プロビジョニング

次のプロビジョニング手順に従ってください: https://medium.com/@giltamari/tensorflow-getting-started-gpu-installation-on-ec2-9b9915d95d6f#.2hv67eeek (つまり、以下を含みませんsudo apt-get update && sudo apt-get -y upgrade)

依存関係とツールのインストール

以下に慣れる：
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install -y build-essential git python-pip libfreetype6-dev libxft-dev libncurses-dev libopenblas-dev gfortran python-matplotlib libblas-dev liblapack-dev libatlas-base-dev python-dev python-pydot linux-headers-generic linux-image-extra-virtual unzip python-numpy swig python-pandas python-sklearn unzip wget pkg-config zip g++ zlib1g-dev libcurl3-dev
sudo pip install -U pip

Cuda 8 のインストール

wget https://developer.nvidia.com/compute/cuda/8.0/prod/local_installers/cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
rm cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
sudo apt-get update
sudo apt-get install -y cuda

cuDNN のインストール

cuDNN の最新バージョンをダウンロードしてインストールします。cuDNN をダウンロードするには、NVIDIA 開発者サイトにログインする必要があるため、wget を使用してファイルをフェッチすることはできません。NVIDIA から次のファイルをダウンロードし、AWS インスタンスにアップロードします。
Linux で CUDA 8.0 用の cuDNN 5.1 をダウンロードします。
scp -i ssh-key.pem パス/to/downloaded/cudnn ubuntu@ec2{インスタンス}.us-west-1.compute.amazonaws.com:~/
sudo tar -xzvf cudnn-8.0-linux-x64-v5.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

環境を構成する

の最後に以下を入れます~/.bashrc: export CUDA_HOME=/usr/local/cuda export CUDA_ROOT=/usr/local/cuda export PATH=$PATH:$CUDA_ROOT/bin export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CUDA_ROOT/lib64:$CUDA_ROOT/extras/CUPTI/lib64
source ~/.bashrc
sudo reboot

ベゼルの取り付け

sudo add-apt-repository -y ppa:webupd8team/java
sudo apt-get update
echo debconf shared/accepted-oracle-license-v1-1 select true | sudo debconf- set-selections
echo debconf shared/accepted-oracle-license-v1-1 seen true | sudo debconf- set-selections
sudo apt-get install -y oracle-java8-installer
sudo apt-get install pkg-config zip g++ zlib1g-dev
https://github.com/bazelbuild/bazel/releases/download/0.3.2/bazel-0.3.2-installer-linux-x86_64.shローカルマシンからec2インスタンスへのscp
chmod +x bazel-0.1.4-installer-linux-x86_64.sh
./bazel-0.1.4-installer-linux-x86_64.sh --user
rm bazel-0.1.4-installer-linux-x86_64.sh
bazel version

Tensorflow のビルドとインストール

git clone --recurse-submodules https://github.com/tensorflow/tensorflow
cd tensorflow
TF_UNOFFICIAL_SETTING=1 ./configure
以下を除くすべてに対してEnter/デフォルトを押します。
- CUDA バージョン = 8.0、CUDA 依存関係 = 3.0 (k520 gpu)
bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
sudo pip install --upgrade /tmp/tensorflow_pkg/tensorflow-0.12.0rc1-cp27-cp27mu-linux_x86_64.whl

amazon-ec2 tensorflow ubuntu-16.04 cudnn

2016-12-13T09:49:27.217

0 投票する

0 に答える

910 参照

caffe - Caffe で cuDNN を一時的に無効にする

私のtrain_valファイルのすべての単一レイヤーでengine:Caffeを設定せずに、CaffeでcuDNNを一時的に無効にすることは可能ですか? リファクタリングの目的で決定論的な結果を得たいと考えていますが、それを行っていないときは cuDNN を使用し続けます。

caffe cudnn

2016-12-21T22:34:26.123

0 投票する

1 に答える

368 参照

machine-learning - cudnn: CUDNN_SOFTMAX_ACCURATE が正常に動作している場合、CUDNN_SOFTMAX_FAST が NaN を出力する

cudnnSoftmaxForward に float 値の特定のセットを使用すると、CUDNN_SOFTMAX_ACCURATE の代わりに設定 CUDNN_SOFTMAX_FAST が使用されたときに NaN 出力が生成されます。なぜこれが起こっているのか誰にも分かりますか？これはライブラリのバグですか？

CUDNN_SOFTMAX_FAST を使用した結果は次のとおりです。

CUDNN_SOFTMAX_ACCURATE を使用した結果は次のとおりです。

machine-learning neural-network conv-neural-network cudnn softmax

2016-12-24T10:43:39.813

0 投票する

1 に答える

302 参照

cuda - Kepler GPU での cuDNN エラー ARCH_MISMATCH

Alea TK サンプルを実行しているだけです。cuDNN を有効にしない限り、cuDNN に依存する Pooling2D を使用するため、CNN 以外は機能します。

cuDNN を (app.config 経由で) アクティブにする[cuDNN Error] ARCH_MISMATCHと、を呼び出すとすぐにこのエラーが発生しますContext.GpuContext(0)。

cuDNN なしで Context.GpuContext(0) を実行すると、3.0 のコンピューティング機能を備えているはずの「GT 730」であることがはっきりとわかります。

ここで何がうまくいかないのですか？

cuda cudnn aleagpu

2017-01-12T07:02:47.817

問題タブ [cudnn]

theano - Theano が Gpu を見つけられない - Ubuntu 16.04

amazon-ec2 - g2.2xlarge インスタンスに CUDA 8.0 および Tensorflow 0.12 を含む cuDNN 5.1.5 をインストールできない

手順

（注：これらは機能しますが、必要に応じて5.1.5ではなく、cuDNN 5.0をインストールします）

プロビジョニング

依存関係とツールのインストール

Cuda 8 のインストール

cuDNN のインストール

環境を構成する

ベゼルの取り付け

Tensorflow のビルドとインストール

caffe - Caffe で cuDNN を一時的に無効にする

machine-learning - cudnn: CUDNN_SOFTMAX_ACCURATE が正常に動作している場合、CUDNN_SOFTMAX_FAST が NaN を出力する

cuda - Kepler GPU での cuDNN エラー ARCH_MISMATCH

Reference