私はpostgresqlデータベースを持っています。インデックスを作成する必要があるテーブルには、約2,000万行あります。1回の試行でそれらすべてにインデックスを付けたい場合( "select * from table_name"など)、JVMにより多くのメモリを割り当てたとしても、JavaOutOfMemoryエラーが発生します。
SOLRに、テーブルを部分的にインデックス付けするオプションはありますか(たとえば、最初の1000000行に対してSQLを実行し、次にインデックスを作成してから、2番目の100万行に対してSQLを実行します)。
今私はLIMITでSQLクエリを使用しています。しかし、solrがインデックスを作成するたびに、手動で再起動する必要があります。
更新:わかりました、1.4は現在リリースされています。OutOfMemory例外はないようですが、ApacheはDIHで非常に大きな作業を行っていたようです。また、リクエストを介してパラメータを渡し、SQL選択で使用できるようになりました。わお!