ファセットを作成するために no_analysis としてマークされたいくつかのフィールドを使用して es スキーマを作成しました。しかし、一部のデータに空白または小文字が含まれているようです。たとえば、color という名前のフィールドの場合、「BLACK」、「Black」、「Black」という値があり、3 つの異なるファセット タームにつながります。データを変更せずにこれを処理する方法はありますか?
質問する
1634 次
1 に答える
2
キーワード tokenizerを使用すると、テキストをトークン化せずに分析できます。つまり、「Black Dog」は 2 つのトークンに分割されませんが、トークン フィルターを適用してトークンを変更できます。
インデックス設定でカスタム アナライザーを作成し、ファセット対象のフィールドのマッピングで使用する必要があります。
その結果、入力として提供された 3 つの「BLACK」、「Black」、および「Black」のうち、「black」トークンのみにインデックスを付けることができます。
于 2013-05-09T20:00:38.270 に答える