WordDelimiterFilter
withを使用するgenerateNumberParts
と、「123-456」のような文字列を取得し、「123」のクエリが一致するようにインデックスを付けることができます。
私がやりたいことは、先頭のゼロを別の部分生成トランジションのように扱うことです。つまり、"000123" は "123" をトークンとして生成し、"000-123" で始めたかのように "000123" も生成する必要があります。
で先頭のゼロを取り除くことができますPatternReplaceFilter
が、実際にやりたいのは、先頭のゼロを単に破棄するのではなく、文字列を分割することです。
これを行う良い方法は何ですか?
フィルターが実際に変更をもたらす場合、PatternReplaceFilter をハックして元のトークンのインデックスも作成する方が簡単でしょうか? または、WordDelimiterFilter をハックして先行ゼロを認識するには?