0

Lucene を使用してファセット検索を実装します。ドキュメントのインデックスと分類のインデックスがあります。次に、分類法の特定のレベルのファセットを収集します。

私の質問は次のとおりです。タクソノミの特定のカテゴリで索引付けされたドキュメントの数を取得するにはどうすればよいですか?

私の質問は非常に単純だと思いますが、Lucene の API や Google で検索してもメソッドが見つかりませんでした。クラスのnumDocs()メソッドを使用して、インデックス全体のドキュメント数を取得する方法しか見つかりませんでした。IndexReader

4

2 に答える 2

1

インデックス内の各カテゴリに 1 つの用語がある場合、おそらくTermEnum.docFreq()のようなものを使用できますか? IndexReader.terms(Term)から TermEnum オブジェクトを取得できます。

于 2012-10-17T20:45:42.147 に答える
0

正しいクエリを提案するためのインデックス構造についてはよくわかりませんが、カテゴリ内のすべてのドキュメントを検索してクエリを実行すると、返される結果のセットには通常、クエリのヒット。

たとえば、次のいずれかを使用してクエリを実行する場合:

search(Query query, int n)
search(Query query, Filter filter, int n) 

次に、TopDocsオブジェクトを取得します。このオブジェクトから、ヒットの総数をTopDocs.totalHitsから取得できます。

于 2012-10-17T17:12:16.243 に答える