solr - SOLR - 数百万のプレーンテキストファイルをまとめて効率的にインデックス化する

翻译自：https://stackoverflow.com/questions/15940794 2013-04-11T04:28:32.793

234 次

SOLR で 1,000 万個のプレーンテキストファイル (合計 300 ギガまで) をインデックス化する最も迅速で効率的な方法は何ですか?

ファイルは、SOLR インストールと同じサーバーにあります。from solrconfig.xml: mergeFactor は 25、autoCommit は 10000 です

現在、ファイルを /update とで個別に送信していcurlますxargs。これは、高い CPU 使用率で 1 時間あたり約 500k のインデックスを作成します。

助けてくれてありがとう！

solr - SOLR - 数百万のプレーン テキスト ファイルをまとめて効率的にインデックス化する