0

Solr に「OCR_text」というフィールドがあるとします。特定の <doc> のフィールド OCR_text に、「これは foo バーです。私の foo バーは他のユーザーの foo バーを見つけます。」のような文字列が含まれている場合、"同じ <doc> からの OCR_text の foo"?

現在、「OCR_text:foo」を検索すると、「foo」が複数回含まれていても、その からの応答は 1 つしか返されません。その特異な応答内で「foo」のインスタンスを反復処理し、その方法で一意の結果を作成する方法がありますが、クエリの全体的な「numFound」は、指定された <doc で「foo」が見つかった合計回数を反映していません>。

これは、私がよく知らない Solr クエリを作成するための非常に単純な方法であるか、根本的により複雑な問題であると感じています。どんな考えでも大歓迎です。

4

1 に答える 1

1

「numFound」の部分は、1 つのフィールドまたは 1 つのドキュメント内のヒットの合計数ではなく、ドキュメントの数のみを示します。合計ヒット数を見つけるには、TermVectorComponent を使用する必要があります。これについては、こちらこちらで簡単に説明しています。詳細と実装例については、悪意のあるリストを掘り下げることもできます。

于 2012-12-02T23:49:31.170 に答える