Flume を使用してアクセス ログを Spark クラスターに送信しようとしています。しかし、ログ ファイルを読み取るためにカスタム アプリケーション (または Flume ソース) を作成しなければならないという制限がたくさんあります。
私がやろうとしているのは、データをシンクに書き込めない場合に備えて、Flume クライアントにこのソースを通知させることです。ネットワークが常に長時間停止しており、ネットワークが復旧するまで、ディスク上の失敗したログをキューに入れるための十分なディスク領域がないためです。代わりに、ネットワークが起動するまでログの読み取りを停止するようにソースに「指示」し、次に再開するように「指示」したいと思います。しかし、これまでのところ、ドキュメントのエラーに関するコールバックは見たことがありません。
車輪を再発明せずにそのようなシナリオを達成できる方法はありますか?