ログイベントの処理に Kafka を使用しています。単純なコネクタとストリーム変換に関する Kafka Connect と Kafka Streams の基本的な知識があります。
これで、次の構造のログ ファイルが作成されました。
timestamp event_id event
ログ イベントには、event_id で接続された複数のログ行があります (メール ログなど)。
例:
1234 1 START
1235 1 INFO1
1236 1 INFO2
1237 1 END
一般に、複数のイベントがあります。
例:
1234 1 START
1234 2 START
1235 1 INFO1
1236 1 INFO2
1236 2 INFO3
1237 1 END
1237 2 END
時間枠 (START と END の間) は最大 5 分です。
結果として、次のようなトピックが必要です
event_id combined_log
例:
1 START,INFO1,INFO2,END
2 START,INFO2,END
これを達成するための適切なツールは何ですか? Kafka Streams で解決しようとしましたが、方法を理解できます..