問題タブ [cudnn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
174 参照

torch - スクリプトは cuda-memcheck で実行した場合にのみ機能します

torch と cudnn を使用して convnet を作成していて、メモリに問題があります。cuda-memcheck を使用してスクリプトをデバッグしようとしましたが、cuda-memcheck を介して供給されたときに実際に実行されることに気付きました (本来よりも遅いですが)。

cuda-memcheck がバックグラウンドで実行されている場合、スクリプト自体の別のインスタンス化も正常に実行されます。

ここで何が起こっているのでしょうか?

0 投票する
12 に答える
486493 参照

cuda - CuDNN のインストールを確認するには?

私は多くの場所を検索しましたが、インストールされていることを確認する方法ではなく、インストールする方法だけが得られます。NVIDIA ドライバーがインストールされていること、および CUDA がインストールされていることは確認できますが、CuDNN がインストールされていることを確認する方法がわかりません。助けていただければ幸いです、ありがとう!

PS。
これはカフェの実装用です。現在、CuDNN を有効にせずにすべてが機能しています。

0 投票する
0 に答える
185 参照

cuda - cuDNN と SLI テクノロジー

ニューラル ネットワークを操作するための強力なシステムが必要です。CUDA ベースの cuDNN ライブラリを使用することにしました。SLI技術に対応しているか気になります。cuDNN に関する元のチュートリアルを読みましたが、SLI についての言及は見つかりませんでした。CUDA 自体が SLI テクノロジをサポートしているかどうかについても、確固たる答えは見つかりませんでした。

もっと短くするには:

1) cuDNN ライブラリは SLI をサポートしていますか?
2) 上記の質問に対する答えが否定的である場合、1 つのグラフィック カードのみに制限されないようにする方法はありますか?

0 投票する
1 に答える
423 参照

github - cuDNN v2 と互換性のある以前のバージョンの Caffe

cuDNN v2 と互換性があった最新バージョンの Caffe を見つけようとしています。現在のマスターには cuDNN v3 が必要です。私は必要なものを見つけようとして Caffe の github リポジトリを検索してきましたが、これを行う明確な方法はないようです。github でこれを見つける比較的簡単な方法はありますか?

0 投票する
1 に答える
511 参照

python-2.7 - aws ubuntu GPU インスタンスで CUDNN を lda2vec と連携させるにはどうすればよいですか?

ここに記載されているように、lda2vecを使用してGPUを操作しようとしています

CUDA、Chainer (1.6.0)、および CUDNN を正常にインストールしましたが、GPU を True としてプログラムを実行すると、次のようになります。

正しいファイルを CUDA ディレクトリにコピーし、bashrc にパスを追加しました。GPU コンピューティングに関する事前の質問はないので、どんな助けでも大歓迎です

0 投票する
1 に答える
712 参照

eclipse - cuDNN コード サンプルのコンパイル エラー

NVIDIA の cuDNN ライブラリをインストールしてコード サンプルを実行しようとしていますが、これらのエラーが発生し、何が問題なのかわかりません。

Linux centOS、cuda toolkit 7.5、および Titan X (計算能力は 5.2 だと思います) で Nsight Eclipse Edition を使用しています。

前もって感謝します。

0 投票する
0 に答える
154 参照

lua - lstm 言語モデルを Torch に保存する

https://github.com/wojzaremba/lstm/blob/master/main.luaで lstm 言語モデルを使用しています

後で使用するために、トレーニングの最後にモデルを保存したいと考えています。トレーニングの最後に次の行を追加しました

モデルを正常に保存したようです。ただし、そのモデルをロードしてテストしようとすると、非常に困惑します。テストのためだけに、小さなトレーニング インスタンスを実行したところ、テスト セットのパープレキシティは 134 になり、モデルを保存しました。次に、保存したモデルをロードし、まったく同じテスト方法 (関数 run_test) を同じテスト セットに適用しましたが、71675.134 という大きな問題が発生しました (ランダムな重みを使用しても、問題はそれよりもはるかに少なくなります!)。重みのみを保存してロードし、保存する前にそれらを float() に変換するか、cudaTensor として保存しようとしましたが、すべて同じ結果が得られました。

モデル全体を保存した後の読み込みとテストのコードを次に示します。元の main.lua から main メソッドのみを変更しました。

0 投票する
2 に答える
12024 参照

python - Windows 7 64 ビットで theano を使用して cuDnn をセットアップする方法

フレームワークをインストールTheanoしてマシンに CUDA を有効にしましたが、Python コンソールで「theano をインポート」すると、次のメッセージが表示されました。

「CuDNNが利用できません」ということでcuDnn、NvidiaのWebサイトからダウンロードしました。また、環境の「パス」を更新し、「.theanorc.txt」構成ファイルに「optimizer_include=cudnn」を追加しました。

その後、再試行しましたが、次のように失敗しました。

誰でも私を助けることができますか?ありがとう。

0 投票する
2 に答える
140 参照

machine-learning - ニューラル ネット トレーニング用のデータのラベル付け

DNN のトレーニングに使用する画像データにラベルを付けるための優れたツールを知っているか、持っている人はいますか?

具体的には、upperLeftCorner と LowerRightCorner のように画像内の 2 点にラベルを付け、指定されたオブジェクトの周りにバウンディング ボックスを計算します。これはほんの一例ですが、MSCoco データ形式に準拠できるようにしたいと考えています。

ありがとう!

0 投票する
1 に答える
5948 参照

python - Fast/Faster-RCNN を使用して C++ でオブジェクト検出器を作成する最も簡単な方法は何ですか?

Fast/Faster-RCNN と Caffe を使用して C++ でオブジェクト検出器を作成する最も簡単な方法は何ですか?

知られているように、RCNN (領域ベースの畳み込みニューラル ネットワーク) を Caffe で使用できます。

scores, boxes = im_detect(net, im, obj_proposals) を呼び出すdef im_detect(net, im, boxes):

このために使用されるrbgirshick/caffe-fast-rcnn、ROIPooling-layers、および出力bbox_pred

scores, boxes = im_detect(net, im) を呼び出すdef im_detect(net, im, boxes=None):

このために使用されるrbgirshick/caffe-fast-rcnn、ROIPooling-layers、および出力bbox_pred

これらはすべて Python と Caffe を使用していますが、C++ と Caffe ではどのように行うのでしょうか?

分類の C++ の例 (画像の内容を示す) のみがありますが、検出 (画像の内容と場所を示す) の例はありません: https://github.com/BVLC/caffe/tree/master/examples/cpp_classification

単純にrbgirshick/py-faster-rcnnリポジトリを rbgirshick/caffe-fast-rcnnで複製し、pre-tained model をダウンロードし、./data/scripts/fetch_faster_rcnn_models.shこのcoco/VGG16/faster_rcnn_end2end/test.prototxtを使用し、 CaffeNet C++ 分類を少し変更するだけで十分ですか?

bbox_predcls_scoreの 2 つのレイヤーから出力データを取得するにはどうすればよいですか?

すべて (bbox_pred & cls_score) を 1 つの配列に入れますか?

それとも2つの配列で?