-1

「t-150」と「w-elksrc」という 2 つの文字列があるという問題に直面しています。インデックス作成後、次のクエリを配置します:-

クエリ 1:q=name:t-*&facet.query=t-&qt=autocomplete-identifier&hl=true&hl.fl=name&hl.ptc=true

クエリ 2:q=name:w-*&facet.query=w-&qt=autocomplete-identifier&hl=true&hl.fl=name&hl.ptc=true

Query1 は私に "t-150" を返します。ただし、クエリ 2 は "" (空白) を返します。クエリ 2 からダッシュを削除し、「we」を意味するスペースと文字を入れると、結果が得られます。

ClassicTokenizerFactoryフィールド名は、私が使用しているインデックス作成時WordDelimiterFilterFactoryLowerCaseFilterFactoryおよびクエリ時WhitespaceTokenizerFactoryに「テキスト」タイプですLowerCaseFilterFactory

ありがとう!

4

1 に答える 1

1

は、ストリームを次のClassicTokenizerFactoryように扱います -

単語に数字が含まれていない限り、単語はハイフンで分割されます。その場合、トークンは分割されず、数字とハイフンは保持されます。

したがって、ドキュメントによると、入力「t-150」はt-150数値のままになります。ただし、入力 "w-elkscr" は と の 2 つのトークンに分割されwますelkscr

于 2013-10-14T09:11:51.953 に答える