次のように一致させたい場合があります。
クエリ: abcd efgh ijkl mnop
この後、クエリは NGram トークナイザーにかけられ、各単語は 2 つのグラム トークンに分割されます。
例) クエリは次のように分割されます。
ab,bc,cd,ef,fg,gh,ij,jk,kl,mn,no,op
マッチング中に、単語のトークンの最小一致をカスタマイズしたいと思います。
つまり、デフォルトでは、単語に対応するいずれかのトークンが索引付きドキュメントと一致すると、mm=1 で、その索引付きドキュメントが返されます。また、mm=2 を指定すると、任意の 2 単語の任意の 1 つのトークンが、返されるインデックス付きドキュメントと一致する必要があります。
しかし、私が望むのは、「m」トークンがそれぞれ mm=num of words に一致する場合にのみドキュメントを返すことです。
例) インデックス付きドキュメントを選択するには、少なくとも 3 つの単語から少なくとも 2 つのトークンが必要です。
Lucene の IndexSearcher がこのコア部分を行っているようです。上記のことを行うコードまたはその他の構成を変更する必要がありますか?
前もって感謝します...