0

WordDelimiterFilterwithを使用するgenerateNumberPartsと、「123-456」のような文字列を取得し、「123」のクエリが一致するようにインデックスを付けることができます。

私がやりたいことは、先頭のゼロを別の部分生成トランジションのように扱うことです。つまり、"000123" は "123" をトークンとして生成し、"000-123" で始めたかのように "000123" も生成する必要があります。

で先頭のゼロを取り除くことができますPatternReplaceFilterが、実際にやりたいのは、先頭のゼロを単に破棄するのではなく、文字列を分割することです。

これを行う良い方法は何ですか?

フィルターが実際に変更をもたらす場合、PatternReplaceFilter をハックして元のトークンのインデックスも作成する方が簡単でしょうか? または、WordDelimiterFilter をハックして先行ゼロを認識するには?

4

0 に答える 0