MySQL データベースを solr インデックスに追加しようとしました。データのインポート プロセスが完了すると、"1428760" ドキュメントが更新されたと表示されます。しかし、solr full search query show numFound="546195"
.
何が問題ですか?このミスマッチはなぜ?
MySQL データベースを solr インデックスに追加しようとしました。データのインポート プロセスが完了すると、"1428760" ドキュメントが更新されたと表示されます。しかし、solr full search query show numFound="546195"
.
何が問題ですか?このミスマッチはなぜ?
ここをチェックしてください:
http://lucene.472066.n3.nabble.com/Changing-value-of-start-parameter-affects-numFound-td2460645.html
一部の人は、solr の重複ドキュメントについて何か言っています。インデックスを再作成する前に、ドキュメントを明示的に削除する必要があるようです。
1,428,760 は管理パネルや CoreAdmin API などの権限のある場所からのものであり、546,195 はワイルドカード検索に対する一致の数であると推測しています。
ヘッダーを確認してください。partialResults
true に設定されたフラグはありますか? その場合、SolrtimeAllowed
はインデックスをスキャンするときに内部タイムアウトに達し、一致するすべてのドキュメントの部分的なセットのみを返しました。
これは、パフォーマンスに対する Solr の好みを示す 1 つの機能です。クエリに最も関連性の高い結果をできるだけ早く提供しようとします。多くのドキュメントがクエリに一致する場合、関連性にあまり影響を与えることなく、時間を節約してすばやく返すことができると想定します。50 万回のヒットを記録するのは誰でしょうか?
とにかく、これ以上の詳細は省きますが、これはただの推測であり、 の簡単な説明ですpartialResults
。