0

現在、elasticsearch-results のコーナー ケースを改善しようとしています。特に頭痛の種の 1 つは、「google+」が単純に「google」に縮小されていることです。通常、特殊文字を省略しても問題ありませんが、これについては例外が必要です。これを達成する方法はありますか?

次の設定を試しました。

{
  "index": {
    "analysis": {
      "analyzer": {
        "default": {
          "tokenizer": "standard",
          "filter": [
            "synonym",
            "word_delimiter"
          ]
        }
      },
      "filter": {
        "synonym": {
          "type": "synonym",
          "synonyms_path": "analysis/synonym.txt"
        },
        "word_delimiter": {
          "type": "word_delimiter",
          "protected_words_path": "analysis/protected.txt"
        }
      }
    }
  }
}

protected.txt には google+ を含む 1 行が含まれています

4

2 に答える 2

0

パターンの置き換えの方が良いと思います - http://www.elasticsearch.org/guide/reference/index-modules/analysis/pattern_replace-tokenfilter.html

于 2012-10-21T05:11:43.417 に答える
0

標準のトークナイザー+がfromを取り除いていると思いgoogle+ます。analyze apiを使用して確認できます。代わりに空白トークナイザーを使用し、既に使用している単語区切りトークン フィルターを適切に構成します。

于 2012-10-17T09:03:06.613 に答える