0

Hibernate クラスでStandardTokenizerFactoryas myを使用しています。@TokenizerDefが単語をトークン化する方法を維持したいのですStandardTokenizerFactoryが、フィールド内のすべての単語を連結する (具体的にはすべてのスペースを削除する) ことによってトークンを作成する別のルールを追加します。

私が望むものを達成するための最も簡単な方法または代替方法は何ですか?

4

1 に答える 1

0

必要なのは、フィルター チェーン内の別のトークン フィルター (ファクトリ) だと思います。あなたはShingleFilterFactoryを見たことがありますか? これは非常によく似た処理を行い、トークン セパレーターを構成できます。空の文字列でもよいかどうかはわかりません。他に何もなければ、ShingleFilterFactory に基づいて独自の ConcatenatingFilterFactory を作成できます。

于 2013-11-07T12:33:28.077 に答える