編集済み:(コンパイル時にエラーはありませんが、共有ライブラリを使用するとエラーまたは警告が表示されます)
CPUからGPUに移植した機能があります。port.cu で cuda 関数を定義し、gpu カーネルを呼び出す関数は CNVEncoderH264.cpp から呼び出されます。
別のプログラムで使用する共有ライブラリを作成するために、これら 2 つのファイルをリンクして収集したいのですが、これが私の make ファイルです。
port.o: port.cu
nvcc -m64 -arch=sm_20 -dc -Xcompiler '-fPIC' port.cu -c -o port.o
nvcc port.cu -c -o cudafile.o
main.o: main.cpp ../core/include/nvFileIO.h
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
ffmpeg_interface.o: ffmpeg_interface.c ../core/include/nvFileIO.h
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
NvPthreadABI.o: ../core/threads/NvPthreadABI.cpp
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
NvThreadingClasses.o: ../core/threads/NvThreadingClasses.cpp
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
NvThreadingLinux.o: ../core/threads/NvThreadingLinux.cpp
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
utilities.o: src/utilities.cpp
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
xcodeutil.o: src/xcodeutil.cpp inc/xcodeutil.h
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
CNVEncoderH264.o: src/CNVEncoderH264.cpp utilities.o ffmpeg_interface.o inc/CNVEncoder.h
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
CNVEncoder.o: src/CNVEncoder.cpp inc/CNVEncoder.h
$(GCC) $(CCFLAGS) $(EXTRA_CCFLAGS) $(INCLUDES) -o $@ -c $<
libnvenc.so: port.o NvPthreadABI.o NvThreadingClasses.o NvThreadingLinux.o xcodeutil.o CNVEncoder.o CNVEncoderH264.o utilities.o ffmpeg_interface.o
gcc -shared -Wl,-soname,$@ -o $@ port.o NvPthreadABI.o NvThreadingClasses.o NvThreadingLinux.o xcodeutil.o CNVEncoder.o CNVEncoderH264.o utilities.o ffmpeg_interface.o -lstdc++ -lnvidia-encode -lcuda -lcudart $(LDFLAGS) $(EXTRA_LDFLAGS)
これは私のmakeコマンドの出力です:
nvcc -m64 -arch=sm_20 -dc -Xcompiler '-fPIC' port.cu -c -o port.o
nvcc port.cu -c -o cudafile.o
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o NvPthreadABI.o -c ../core/threads/NvPthreadABI.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o NvThreadingClasses.o -c ../core/threads/NvThreadingClasses.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o NvThreadingLinux.o -c ../core/threads/NvThreadingLinux.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o xcodeutil.o -c src/xcodeutil.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o CNVEncoder.o -c src/CNVEncoder.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o utilities.o -c src/utilities.cpp
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o ffmpeg_interface.o -c ffmpeg_interface.c
g++ -m64 -O0 -ggdb3 -fPIC -fopenmp -I/usr/local/cuda/include -I./include -I../inc -I../core -I../core/include -I./inc -I . -o CNVEncoderH264.o -c src/CNVEncoderH264.cpp
gcc -shared -Wl,-soname,libnvenc.so -o libnvenc.so port.o NvPthreadABI.o NvThreadingClasses.o NvThreadingLinux.o xcodeutil.o CNVEncoder.o CNVEncoderH264.o utilities.o ffmpeg_interface.o -lstdc++ -lnvidia-encode -lcuda -lcudart -L/usr/local/cuda/lib64 -lcuda -lcudart -L/usr/lib64 -lnvidia-encode -ldl
プログラムでこの共有ライブラリを使用すると、次のエラーが発生します。
symbol lookup error: /usr/local/lib/libnvenc.so: undefined symbol: __cudaRegisterLinkedBinary_39_tmpxft_0000257a_00000000_6_port_cpp1_ii_58a1dcc4
うまくリンクできていないようですが、どうしたのですか?
編集:以前に共有ライブラリを使用するときのコマンド
enabled libnvenc && require libnvenc x264.h x264_encoder_encode -Wl,-Bdynamic -lnvenc &&
{ check_cpp_condition x264.h "X264_BUILD >= 118" ||
die "ERROR: libnvenc version must be >= 0.118."; }
友人の提案の後、-lnvenc の後に -L/usr/local/cuda/lib64 -lcudart を追加しました。