この質問がどこかですでに回答されている場合は、事前にお詫び申し上げます - 私はそれを見つけることができませんでした.
私は Solr に比較的慣れていないので、デフォルトの SimplePostTool を使用してコマンド ラインからデータのインデックスを作成するためのチュートリアルの指示に従っています。現在、テストで Solr 4.0 を使用しています。
まず、クエリによってインデックス内のすべてを削除します。次に、SimplePostTool をいくつかのディレクトリにポイントし、何万ものファイルのインデックスを作成します。私の場合、今のところ、各 XML ファイルは個別のドキュメントです。一部のドキュメントは同じ uniqueKey ID を持つ場合があります。重要な場合、XML ドキュメントのサイズは 4 ~ 60kB の範囲です。
SimplePostTool が完了すると返され、26,541 個のファイルがインデックス化されたと表示されます。次に、管理コレクション 1 ページを見ると、Num Docs = 20,985 および Max Doc = 22,921 と表示されます。
Num Docs と Max Doc の不一致について議論している他の投稿を見たことがあります (上書き動作を十分に理解していると思います)。私の質問は、SimplePostTool によって報告されたインデックス付きドキュメントの数が、Solr 管理ページで指定された最大ドキュメントと一致しないのはなぜですか?