0

ES を使用して、データベースから ~1.5mil のレコードをインデックス化しています。インデックスを設定するために、「存在する場合は上書きする」に設定された Pentaho ES コンポーネントを使用しています (約 15 分実行)。また、個々のインデックス付きドキュメントは、Java サービスを介して取得、更新、または削除できます。

問題は、完全な Pentaho アップデートの実行中に ES が何を返すかということです。たとえば、バージョン = 1 の 1.5mil のインデックス付きドキュメントがあります。次の更新でこのバージョンが 2 に変更されます。Pentaho がドキュメントを更新している間にドキュメントをリクエストすると、古いバージョンのドキュメントを受け取りますか? その特定のドキュメントについてサービスを利用できなくなりますか? また、古いバージョンを受け取った場合、新しいバージョンは更新後すぐに利用できますか、それとも完全なバッチが更新されるまで待ちますか (pentaho コンポーネントは 5k のバッチで行を送信しています)?

ペンタホ - 4.4

エラスティックサーチ - 0.19.4

ルセン - 3.6.0

4

1 に答える 1

1
  1. 新しいドキュメントがまだコミットされていない場合は、古いバージョンのドキュメントを受け取ります。このサービスは引き続きご利用いただけます。
  2. refresh_interval新しいバージョンは、elasticsearchの設定に応じて利用できるようになります。これはデフォルトですべてになり1sます。

refresh_intervalデータの読み込み中にpentahoがいじる可能性があります。その場合は、pentahoがrefreshメソッドを直接呼び出すか、パラメーターがリセットされるまで待つ必要があります。

refresh_interval実行を開始してから、ビアの設定を確認するだけです。

curl -XGET "http://my-es-server:9200/my-index-name/_settings"
于 2013-03-06T20:21:11.993 に答える