Azure で新しい Windows Server 2019 データ サイエンス仮想マシンを実行しています。Tesla K80 GPU を搭載した NC6_Promo サイズを使用しています。展開が完了したら、次の python コマンドを使用して CUDA が機能しているかどうかを確認しようとしました。
import torch
torch.cuda.is_available()
Out[3]: False
これは、CUDA が利用できないことを示す偽のステートメントを返します。
nvidia-smi ツールで確認すると、次の応答が返されます。
Microsoft Windows [Version 10.0.17763.2300]
(c) 2018 Microsoft Corporation. All rights reserved.
C:\Users\administrator>nvidia-smi
Wed Dec 22 11:23:36 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 472.50 Driver Version: 472.50 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name TCC/WDDM | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Tesla K80 TCC | 00000001:00:00.0 Off | 0 |
| N/A 42C P8 28W / 149W | 9MiB / 11448MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
これは、CUDA バージョン 11.4 が利用可能であることを示しています。
仮想マシンのデバイス マネージャにも、Tesla K80 GPU がインストールされ、正常に動作していると表示されます。
これまでに行った手順:
- nVidia 仮想マシン拡張機能を有効にする
- Tesla K80用の最新のnVidiaドライバーを(再)インストールしました
- CUDA をバージョン 11.5 にアップグレードしました
ただし、PyTorch から GPU を使用することはできません。これを機能させるために他にできることはありますか?これは本当にすぐに使えるはずです。