これがどのように行われるかについてのヒントはありますか?
を使用してみましたPatternTokenizerFactory
が、期待どおりに動作しません。
を書かずにこれを行うことは可能custom tokenizer
ですか?
KeyWordTokenizerFactory を使用して問題のフィールドをトークン化し、ワイルドカード検索を行うことができます
http://solr.pl/en/2010/12/20/wildcard-queries-and-how-solr-handles-them/
上記のトークナイザーで機能しない他の操作を行っていないことを条件として。
もう一つの方法は回り道です。次の手法(またはその他の手法)を使用して、スペースが取り除かれたコピーフィールドを作成できます。
その後、WhiteSpaceTokenizer を使用してその copyfield をトークン化し (copyfield 値にスペースがないため、基本的に 1 つのトークンのみを作成します)、それに対してワイルドカード検索を実行できます。
2 番目のアプローチは、場合によっては失敗する可能性があります (たとえば、"wor them" は、スペースが削除された後に "worth*" と一致します)。