問題タブ [tensorflow-gpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow-gpu - tensorflow を gpu バージョンにアップグレードしている間、それは PermissionError をスローします
例外: トレースバック (最後の最後の呼び出し): ファイル "C:\ProgramData\Anaconda3\lib\site-packages\pip\basecommand.py"、215 行目、メイン ステータス = self.run(options, args) ファイル "C :\ProgramData\Anaconda3\lib\site-packages\pip\commands\install.py"、342 行目、実行中 prefix=options.prefix_path、ファイル "C:\ProgramData\Anaconda3\lib\site-packages\pip\req \req_set.py"、784 行目、インストール **kwargs ファイル "C:\ProgramData\Anaconda3\lib\site-packages\pip\req\req_install.py"、851 行目、インストール self.move_wheel_files(self.source_dir 、ルート = ルート、プレフィックス = プレフィックス) ファイル "C:\ProgramData\Anaconda3\lib\site-packages\pip\req\req_install.py"、1064 行目、move_wheel_files 内 = self.isolated、ファイル "C:\ProgramData \Anaconda3\lib\site-packages\pip\wheel.py",move_wheel_files clobber(source, lib_dir, True) ファイルの 345 行目 "C:\ProgramData\Anaconda3\lib\site-packages\pip\wheel.py"、323 行目の clobber shutil.copyfile(srcfile, destfile) ファイル " C:\ProgramData\Anaconda3\lib\shutil.py"、115 行目、fdst として open(dst, 'wb') を指定した copyfile: PermissionError: [Errno 13] Permission denied: 'C:\ProgramData\Anaconda3\Lib\サイトパッケージ\wheel\archive.py'\ProgramData\Anaconda3\Lib\site-packages\wheel\archive.py'\ProgramData\Anaconda3\Lib\site-packages\wheel\archive.py'
python - Tensorflow での GPU Op の追加
このドキュメントに従って、大まかに TensorFlow に新しい op を追加しようとしています。違いは、GPU ベースの op を実装しようとしているということです。追加しようとしている op は、ここからの cuda op です(cuda_op.py、cuda_op_kernel.cc、cuda_op_kernel.cu.cc)。これらをテンソルフローの外でコンパイルし、tf.load_op_library
それらをプルするために使用しようとしています。いくつかの変更を加えたので、ここに私のファイルがあります:
cuda_op_kernel.cc
cuda_op_kernel.cu
CMakeLists.txt
test.py
コンパイルしてtest.py
正常に実行できますが、出力は常に[0 0 0 0 0]
. とで置き換えるAddOneKernel<<<32, 256>>>(in, N, out);
と、op は正しい値を(まったく同じで) 出力します。for (int i = 0; i < N; i++) out[i] = in[i] + 1;
DEVICE_GPU
DEVICE_CPU
[6 5 4 3 2]
CMakeList.txt
返される正しい値を取得する方法はありますか?