java - solr "-" が機能しない場合と機能する場合があります

Question

「t-150」と「w-elksrc」という 2 つの文字列があるという問題に直面しています。インデックス作成後、次のクエリを配置します:-

クエリ 1:q=name:t-*&facet.query=t-&qt=autocomplete-identifier&hl=true&hl.fl=name&hl.ptc=true

クエリ 2:q=name:w-*&facet.query=w-&qt=autocomplete-identifier&hl=true&hl.fl=name&hl.ptc=true

Query1 は私に "t-150" を返します。ただし、クエリ 2 は "" (空白) を返します。クエリ 2 からダッシュを削除し、「we」を意味するスペースと文字を入れると、結果が得られます。

ClassicTokenizerFactoryフィールド名は、私が使用しているインデックス作成時WordDelimiterFilterFactory、LowerCaseFilterFactoryおよびクエリ時WhitespaceTokenizerFactoryに「テキスト」タイプですLowerCaseFilterFactory。

ありがとう！

score 1 · Accepted Answer

は、ストリームを次のClassicTokenizerFactoryように扱います -

単語に数字が含まれていない限り、単語はハイフンで分割されます。その場合、トークンは分割されず、数字とハイフンは保持されます。

したがって、ドキュメントによると、入力「t-150」はt-150数値のままになります。ただし、入力 "w-elkscr" はとの 2 つのトークンに分割されwますelkscr。

java - solr "-" が機能しない場合と機能する場合があります

1 に答える 1

Related

Reference