Apache Samza は、ローカル ストレージのストレージ エンジンとして RocksDB を使用します。これにより、ステートフルなストリーム処理が可能になります。ここに非常に優れた概要があります。
私のユースケース:
- Apache Kafka などのシステムから取得した、処理したいイベントの複数のストリームがあります。
- これらのイベントは状態を作成します。追跡したい状態は、以前に受信したメッセージに基づいています。
- 計算された状態に基づいて、新しいストリーム イベントを生成したいと考えています。
- 入力ストリーム イベントは高度に接続されており、OrientDB / Neo4J などのグラフは、データをクエリして新しいストリーム イベントを作成するための理想的な媒体です。
私の質問:
KV 以外のストアを Samza のローカル ストレージとして使用することはできますか? OrientDB / Neo4J でこれを行ったことがあり、例を知っている人はいますか?