ES を使用して、データベースから ~1.5mil のレコードをインデックス化しています。インデックスを設定するために、「存在する場合は上書きする」に設定された Pentaho ES コンポーネントを使用しています (約 15 分実行)。また、個々のインデックス付きドキュメントは、Java サービスを介して取得、更新、または削除できます。
問題は、完全な Pentaho アップデートの実行中に ES が何を返すかということです。たとえば、バージョン = 1 の 1.5mil のインデックス付きドキュメントがあります。次の更新でこのバージョンが 2 に変更されます。Pentaho がドキュメントを更新している間にドキュメントをリクエストすると、古いバージョンのドキュメントを受け取りますか? その特定のドキュメントについてサービスを利用できなくなりますか? また、古いバージョンを受け取った場合、新しいバージョンは更新後すぐに利用できますか、それとも完全なバッチが更新されるまで待ちますか (pentaho コンポーネントは 5k のバッチで行を送信しています)?
ペンタホ - 4.4
エラスティックサーチ - 0.19.4
ルセン - 3.6.0