最初の出版物と lucene バージョン 1.4.3 から動作中の lucene のコードを使用しています。シンプルなアナライザーを使用して、txt ファイル内の「ブック ブック ブック」であるデータを分析します。ただし、lukeall を使用してデータを参照すると、ランク列は「本」が 1 回しか発生しないことを示していますが、3 であると予想しています。



1 に答える 1


What gave you the impression that Luke's "Rank" column would display the number of occurances of the term like that? I believe in 0.9, Rank displays the docfreq, that is, the number of documents in which the term appears (in later version, "Rank" is sequential, and "Freq" provides that statistic). Adding some more data to your index would likely clarify what those statistics are meant to indicate.

于 2013-06-21T15:39:50.667 に答える