apache - Apache Solr-DBテーブルのインデックスを作成すると、テーブルに含まれているよりも多くのレコードが取得されるようです

Question

私はSolrを初めて使用するので、意味のないことを言っている場合はお知らせください。

最近、Solr 4.0ベータ版をセットアップしましたが、非常にうまく機能しています。MySQLDBからビューを読み取るようにDIHで設定されています。ビューには、約2,000万行と16列が含まれています。多くの列には多くのNULL値があります。DBのパフォーマンスは非常に良好です。手動でクエリを実行すると、ビューに対して1秒未満のクエリ時間が発生します。

Solrをビューに向けると、インデックス作成プロセスが開始されました。4時間後に戻って確認したところ、まだインデックスが作成されているだけでなく、2億を超えると報告されていることがわかりました。

Solrがどのように機能するかを誤解していますか？私は、DBにあるものと同じ数の行（約2,000万）をフェッチすることを想定していました。または、実際に各フィールドをフェッチされたアイテムとしてカウントしていますか？または、さらに悪いことに、それはある種のループにありますか？

クエリを100,000レコードに制限することにより、まったく同じビューからのデータの小さなサブセットを使用して、いくつかの事前テストを行いました。完了すると、正確に100,000をフェッチしたと報告されました。ログにも警告/エラーが表示されません。

何が起こっているのかについて何かアイデアはありますか？

score 0 · Accepted Answer

数値は db の行を表します。db-data-config.xml ファイルを投稿していただけますか? SQLをもう一度確認する必要があると思います。

apache - Apache Solr-DBテーブルのインデックスを作成すると、テーブルに含まれているよりも多くのレコードが取得されるようです

1 に答える 1

Related

Reference