私はSolrを初めて使用するので、意味のないことを言っている場合はお知らせください。
最近、Solr 4.0ベータ版をセットアップしましたが、非常にうまく機能しています。MySQLDBからビューを読み取るようにDIHで設定されています。ビューには、約2,000万行と16列が含まれています。多くの列には多くのNULL値があります。DBのパフォーマンスは非常に良好です。手動でクエリを実行すると、ビューに対して1秒未満のクエリ時間が発生します。
Solrをビューに向けると、インデックス作成プロセスが開始されました。4時間後に戻って確認したところ、まだインデックスが作成されているだけでなく、2億を超えると報告されていることがわかりました。
Solrがどのように機能するかを誤解していますか?私は、DBにあるものと同じ数の行(約2,000万)をフェッチすることを想定していました。または、実際に各フィールドをフェッチされたアイテムとしてカウントしていますか?または、さらに悪いことに、それはある種のループにありますか?
クエリを100,000レコードに制限することにより、まったく同じビューからのデータの小さなサブセットを使用して、いくつかの事前テストを行いました。完了すると、正確に100,000をフェッチしたと報告されました。ログにも警告/エラーが表示されません。
何が起こっているのかについて何かアイデアはありますか?