私は Docker、特に Nvidia-Docker が初めてです。コードを docker コンテナーにラップして、一部のホストで実行しようとしています。しかし、どうやら何かがうまくいかず、ドッカーでコードを実行できません。Nvidia-docker をインストールしました。Dockerfile はhereから取得されます。ここに私の完全なドッカーコードがあります
FROM nvidia/cuda:9.1-runtime-ubuntu16.04
RUN apt-get update && apt-get install -y \
cuda-command-line-tools-$CUDA_PKG_VERSION \
cuda-libraries-dev-$CUDA_PKG_VERSION \
cuda-minimal-build-$CUDA_PKG_VERSION \
&& \
rm -rf /var/lib/apt/lists/*
ENV LIBRARY_PATH /usr/local/cuda/lib64/stubs
FROM python:3.7-slim
RUN pip install numpy
RUN apt update && \
apt-get -y install gcc && \
apt-get -y install g++
ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
ADD helmsolver /helmsolver
CMD dpkg -l | grep -i cuda
CMD cd helmsolver && bash tests.sh
cudahelmf と cudahelmd が事前にコンパイルされている bash スクリプト コード
nvcc helm3dcudafnd.cu -o cudahelm -I/usr/local/cuda/samples/common/inc/ -lcufft -lcufftw -D DOUBLE
#!/bin/sh
mkdir helmholtz
cd helmholtz
mkdir build
mkdir workdir
mkdir src
mkdir scripts
ls
cp ../cudahelmf ./build
cp ../cudahelmd ./build
cp ../tmp.py ./scripts/
cd workdir
python3 ../scripts/script1.py 21 21 1
../build/cudahelmd config.cfg >> results_double.txt
../build/cudahelmf config.cfg >> results_float.txt
ドッカーをビルドして実行するには、私が使用します
nvidia-docker build -t helm .
nvidia-docker run --rm -ti helm
そして、実行した後、エラーが発生しました
../build/cudahelmd: error while loading shared libraries: libcufft.so.9.1: cannot open shared object file: No such file or directory
私は何を間違っていますか?-lcufft コンパイル オプションが原因で発生し、docker はそれを取得する場所を認識していませんか? また、インストール後、docker には /usr/local/cuda/ ディレクトリがありません。cuda-libraries-dev に cufft ライブラリが含まれており、インストールが正常に終了したため、奇妙に思えます。
これは、コードがコンパイルされ、以前にテストされた私のコンピューターの nvcc バージョンです。
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85
そして nvidia-docker バージョン
Docker version 19.03.3, build a872fc2f86
PS たぶん、docker でコードをコンパイルするオプションがありますか?