java - 複数のデータストアにまたがる Java でトランザクションを処理するためのアプローチは何ですか?

Question

データベースとファイルシステムを含む複数のデータストア間でトランザクションを処理する最善の方法を教えてください。

シナリオは次のとおりです。

テキストとバイナリを含むデータを保存する必要があるシステムがあるとします。テキストはメタデータ情報を提供し、バイナリデータは格納される実際のデータです。また、クライアントが設定したメタデータに基づいてデータを検索できる必要があります。

これにより、データを 3 つの形式で格納するアーキテクチャがもたらされます。 1. バイナリデータをファイルシステムに格納します。 2. ファイルシステム上のバイナリデータへのポインタ (ID、場所) を含む RDBMS 内のレコード 3. インデックス内のレコードメタデータに基づく検索要件のための Solr/Lucene のようなエンジン。

Solr/Lucene インデックスが破損した場合に再インデックスを実行できるように、RDBMS の使用は信頼性のためであることに注意してください。

上記のシナリオの課題は、それぞれが異なるデータストアであり、独自のトランザクション動作を持っていることです。RDBMS はトランザクション機能を提供しますが、他の 2 つにはありません。

問題は、複数のデータストアにまたがるトランザクション動作を作成したいということです。これは、いずれかのデータストアで障害が発生すると、他の 2 つのデータストアの変更が元に戻ることを意味します。

また、情報を検索する必要があるプライマリデータストアをどこにするかという問題も生じます。そのため、各データストアへのデータストレージの順序が非常に重要になります。

例では、私は次のことをしたいと思います

ファイルシステムにファイルを書き込む
Solr/Lucene でインデックスを作成する
レコードをデータベースに挿入します。

上記のケースで、データベースの挿入に失敗して再試行が行われた場合、データをファイルシステムとインデックスエンジンに上書きできます。サーバーがクラッシュした場合に備えて、データベースレコードがあり、ファイルシステムにデータが保存されていないという状況は望ましくないためです。

検索が主に検索エンジンによって提供される場合、対応するレコードがデータベースに存在しない古いデータが含まれる可能性があります。これは、データストア全体で一貫性の問題があることを意味します。

最後のコミットまでデータストア全体の各レコードの状態を理解し、古いデータをクリーンアップする機能を備えた、ある種の状態エンジンが必要になると思います。

これを処理するための他のアプローチがあることを知りたいですか？複数のデータストアにまたがるデータの挿入と更新のような状況を処理するための他の手法は何ですか?

java - 複数のデータ ストアにまたがる Java でトランザクションを処理するためのアプローチは何ですか?

1 に答える 1

Related

Reference

java - 複数のデータストアにまたがる Java でトランザクションを処理するためのアプローチは何ですか?