独自の VM にそれぞれ 1 つのジョブ マネージャー、2 つのタスク マネージャーを備えた Flink v1.2 セットアップがあります。状態バックエンドをファイルシステムに構成し、上記の各ホストの場合にローカルの場所を指すようにしました (state.backend.fs.checkpointdir: file:///home/ubuntu/Prototype/flink/flink-checkpoints)。並列処理を 1 に設定し、各 taskanager には 1 つのスロットがあります。次に、JobManager でイベント処理ジョブを実行し、それを TaskManager に割り当てます。ジョブを実行している TaskManager を強制終了し、失敗した TaskManager で数回失敗した後、Flink は残りの TaskManager でジョブを実行しようとします。この時点で、対応するチェックポイント/状態が見つからないため、再び失敗します: java.io.FileNotFoundException:
フォルダー /home/ubuntu/Prototype/flink/flink-checkpoints/56c409681baeaf205bc1ba6cbe9f8091 は、私が強制終了した TaskManager にのみ存在し、他のフォルダーには存在しません。
私の質問は、上記の機能が必要な場合、すべてのタスクマネージャーでチェックポイント/状態に同じ場所を設定することになっていますか?
ありがとう!