0

ファセットを作成するために no_analysis としてマークされたいくつかのフィールドを使用して es スキーマを作成しました。しかし、一部のデータに空白または小文字が含まれているようです。たとえば、color という名前のフィールドの場合、「BLACK」、「Black」、「Black」という値があり、3 つの異なるファセット タームにつながります。データを変更せずにこれを処理する方法はありますか?

4

1 に答える 1

2

キーワード tokenizerを使用すると、テキストをトークン化せずに分析できます。つまり、「Black Dog」は 2 つのトークンに分割されませんが、トークン フィルターを適用してトークンを変更できます

インデックス設定でカスタム アナライザーを作成し、ファセット対象のフィールドのマッピングで使用する必要があります。

その結果、入力として提供された 3 つの「BLACK」、「Black」、および「Black」のうち、「black」トークンのみにインデックスを付けることができます。

于 2013-05-09T20:00:38.270 に答える