0

スクリーン セッションで Keras に実装されたニューラル ネットワークをトレーニングすると、Theano との競合状態に陥っているように見えます。

私は次のように進めます。使用しているコンピューティング クラスター (ルート ユーザーではない) に ssh します。

次に実行します:

screen -S model1

次に、このスクリーン セッションに入ったら、モデルをトレーニングする Python スクリプトを実行します。画面を切り離し (Ctrl+A+D)、screen -r を実行すると、すべて問題ありません。ただし、screen -r を実行する前に ssh セッションを終了し、再度ログインするときに screen -r を実行すると、次のエラーが発生します。

compilelock.py", line 91, in get_lock
  File "~/.local/lib/python2.7/site-packages/theano/gof/compilelock.py", line 275, in lock
OSError: [Errno 13] Permission denied: '~/.theano/compiledir_Linux-3.11--generic-x86_64-with-Ubuntu-13.10-saucy-x86_64-2.7.5+-64/lock_dir'
Error in sys.exitfunc:
Traceback (most recent call last):
  File "/usr/lib/python2.7/atexit.py", line 24, in _run_exitfuncs
    func(*targs, **kargs)
  File "~/.local/lib/python2.7/site-packages/theano/gof/cmodule.py", line 1344, in _on_atexit
  File "/usr/lib/python2.7/contextlib.py", line 17, in __enter__
    return self.gen.next()
  File "~/.local/lib/python2.7/site-packages/theano/gof/compilelock.py", line 54, in lock_ctx
  File "~/.local/lib/python2.7/site-packages/theano/gof/compilelock.py", line 91, in get_lock
  File "~/.local/lib/python2.7/site-packages/theano/gof/compilelock.py", line 275, in lock
OSError: [Errno 13] Permission denied: '~/.theano/compiledir_Linux-3.11--generic-x86_64-with-Ubuntu-13.10-saucy-x86_64-2.7.5+-64/lock_dir'

なぜこれが起こるのか誰か知っていますか?ログイン後にログアウトして screen -r を実行しようとしたときにのみ発生するのは興味深いことです。

4

1 に答える 1

1

私の推測では、あなたのホーム ディレクトリは何らかのネットワーク ファイル システム (AFS など) にあると思われます。その場合、セッションを終了するとすぐにファイルシステムのセキュリティ資格情報が無効になり、プロセスは画面内で実行され続けますが、Theano キャッシュ ディレクトリ内のファイルを操作する権限がなくなります~/.theano。この推測が正しければ、問題は競合状態ではありません。

kinit問題が AFS クレデンシャルの有効期限に関連している場合、解決策はコマンドでクレデンシャル キャッシュを使用することです( http://web.mit.edu/kerberos/krb5-1.12/doc/user/user_commands/kinit.html-cのオプションを参照してください)。 )。

于 2015-07-28T10:08:17.247 に答える