-1

uber の horovod ライブラリを使用して、GPU で実行される te​​nsorflow ニューラル ネットワークを実行しようとしています。同時に、複数の gpu 間のnvlinkを測定する測定スクリプトを実行しようとしています。残念ながら、ファイルを実行するたびに、次のエラーが表示されます。

tensorflow.python.framework.errors_impl.NotFoundError: /home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so: 未定義のシンボル: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactoryESt14default_deleteIS8_EE

この問題を解決する方法を知っている人はいますか?

ありがとうございました。

4

1 に答える 1

-1

レポで提起されたこの問題を見てください。

https://github.com/horovod/horovod/issues/656

于 2019-04-05T08:57:33.193 に答える