最近、flume を使用していくつかの試みを行いました。主に、フロント エンド サーバーからバック エンド サーバーにデータをストリーミングして処理します。これは、ローカルの「ログ」ファイルを作成し、flume でそれらを追跡することによって行われました。問題は、flume ノードを再起動すると、ディレクトリ内のすべてのファイルが再送信されることでした。これを効果的に管理する方法はありますか?Flume がファイルの処理を終了したというイベントを発生させることはできますか? チェックポイントが組み込まれていますか?
そうでない場合、そのようなことを行うためのアプローチは何でしょうか?