0

編集:以下のコメントで解決しました。

CUDA + RAPIDS を使い始めようとしています。これを行うために、Ubuntu 18.04 と NVIDIA Tesla K80 を使用して Google Compute で VM を起動しました。ソフトウェアをインストールするために実行したコマンドは次のとおりです。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-1-local-10.1.243-418.87.00/7fa2af80.pub
sudo apt-get update
sudo apt-get -y upgrade
sudo apt-get -y install cuda gcc
sudo apt-get -y autoremove

wget https://repo.anaconda.com/archive/Anaconda3-2019.07-Linux-x86_64.sh
bash Anaconda3-2019.07-Linux-x86_64.sh 
source ~/.bashrc

conda update -n base -c defaults conda

conda create --name test3.7 python=3.7
conda activate test3.7

conda install -c rapidsai -c nvidia -c numba -c conda-forge -c anaconda \
    cudf=0.9 cuml=0.9 cugraph=0.9 python=3.7 anaconda::cudatoolkit=10.0

conda install -c anaconda -c conda-forge -c plotly scipy chardet numpy pandas scikit-learn matplotlib plotly chart-studio

sudo shutdown -r now

次に、pandas の代わりに cudf を使用して少量の Python を実行しようとすると、次のエラーが発生します。

terminate called after throwing an instance of 'thrust::system::system_error'
  what(): parallel_for failed: no kernel image is available for execution on the device
Aborted (core dumped)

たくさんのガイドを読んだので、何が欠けているのかわかりません。「これらの一握りのコマンドを実行するだけで、準備完了です!」と書かれています。同じコマンドがリストされています。ごく最近、ソースから CUDA ドライバーをコンパイルするために nvcc を使用することになっていることがわかりましたが、使用するコマンドを示すガイドがどこにも見つかりません (誰もが数百ページの長い PDF を指しているだけです)。実際に役立つコマンドを提供するのではなく、NVIDIA によって)。では、Tesla K80 を使用して Ubuntu 18.04 システムで CUDA + RAPIDS を実行するには、他に何をする必要がありますか?

ありがとうございました!

4

1 に答える 1