SOLR で 1,000 万個のプレーン テキスト ファイル (合計 300 ギガまで) をインデックス化する最も迅速で効率的な方法は何ですか?
ファイルは、SOLR インストールと同じサーバーにあります。from solrconfig.xml
: mergeFactor は 25、autoCommit は 10000 です
現在、ファイルを /update と で個別に送信していcurl
ますxargs
。これは、高い CPU 使用率で 1 時間あたり約 500k のインデックスを作成します。
助けてくれてありがとう!