h2o.randomForest() を使用したランダム フォレスト モデルがあります。
ここで、h2o.predict() を使用して大量のデータをスコアリングする必要があります。いくつかの制約により、すべてのデータを一度にスコア付けすることはできません。基本的に、ループ内のさまざまなデータセットにスコアを付けたいと考えています。したがって、プロセスを高速化するために、2 つの異なる R インスタンスで同じスクリプトを実行して、複数のデータセットを同時にスコアリングしたいと考えています。しかし、それを行うと、1 つのインスタンスは正常に動作しますが、他のインスタンスでは次のエラーが発生します。両方のインスタンスでこのエラーが発生する場合があります。
Error in .h2o.__checkConnectionHealth(conn) :
H2O connection has been severed. Cannot connect to instance at http://127.0.0.1:54321/
Failed to connect to 127.0.0.1 port 54321: Address already in use
上記のエラーには一貫性さえありません。
私はh2oを初期化し、すべてのRインスタンスで次のように予測しています。
h2oServer = h2o.init(nthreads = -1, max_mem_size = '8g')
h2.predict(model, test_data)
どうすればこれを達成できますか?2 つの異なる R インスタンスを介して h2o クラウドを使用するにはどうすればよいですか?
ありがとう、