uber の horovod ライブラリを使用して、GPU で実行される tensorflow ニューラル ネットワークを実行しようとしています。同時に、複数の gpu 間のnvlinkを測定する測定スクリプトを実行しようとしています。残念ながら、ファイルを実行するたびに、次のエラーが表示されます。
tensorflow.python.framework.errors_impl.NotFoundError: /home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so: 未定義のシンボル: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactoryESt14default_deleteIS8_EE
この問題を解決する方法を知っている人はいますか?
ありがとうございました。