次のシナリオがあります。SQL データベースから「x」個のレコード (X は数十万のオーダー) を読み取り、それらを SOLR ドキュメントに変換し、インデックスを作成して SOLR にコミットするバッチ プロセス。そう ...
1) DB からの読み取り
2) 変換
3) コミット
このプロセスは毎日実行されます。数日後、SOLR プロセスは常に可能な最大スレッド数 (1024) に達します。私は SOLR の経験はあまりありませんが、問題はコミットが多すぎることにあると感じています。
「Y」変換の後にコミットすることを考えていました(「Y」はメモリの問題を引き起こすほど大きくありません)。これは最善のアプローチですか?以前にこの問題に遭遇した人はいますか?
PS: SOLR 4 を使用しています。Java をクライアントとして使用しています。
ありがとう