最近公開されたホワイト ペーパーと GitHub のRFCによると、テンソルフロー イーガーは現在、分散実行をサポートしています。グラフ モードと同様に、デバイス名を「/job:training/task:2/device:GPU:0」のように設定することで、リモート デバイスで操作を熱心に実行できることが言及されています。ただし、その方法に関するコード例やチュートリアルは見つかりません。
グラフと熱心なモードの両方をサポートする分散トレーニング用の高レベル API であるtf.distributeに関するチュートリアルがたくさんあることに注意してください。しかし、熱心なモードの内部でtf.distribute がどのように機能するかにもっと興味があります。具体的には、次のことを知りたいです。
熱心なモードでクライアントをリモートサーバーに接続する方法は?
クラスター定義はいつ、どのようにイーガー モードで指定されますか?
誰かがそれらの質問に答えてくれたら幸いです。ありがとう!