1

以下のようにトークン文字を登録してトークナイザーを作成すると、Roman 'X' が登録できません。 (Test ES Version : ES6.7, ES5.6)

      "tokenizer": {
        "autocomplete": {
          "type": "edge_ngram",
          "min_gram": 1,
          "max_gram": 14,
          "token_chars": [
            "Ⅹ"
          ]
        }
    }

エラーログはこんな感じ

{"error":{"root_cause":[{"type":"remote_transport_exception","re​​ason":"[node02][192.168.115.x:9300][indices:admin/create]"}],"type ":"illegal_argument_exception","re​​ason":"不明な トークン タイプ: 'ⅹ'、[symbol、private_use、paragraph_separator、start_punctuation、unassigned、enclosing_mark、connector_punctuation、letter_number、other_number、math_symbol、lowercase_letter、space_separator、surrogate、のいずれかである必要があります。 initial_quote_punctuation、decimal_digit_number、digit、other_punctuation、dash_punctuation、currency_symbol、non_spacing_mark、format、modifier_letter、control、uppercase_letter、other_symbol、end_punctuation、modifier_symbol、other_letter、line_separator、titlecase_letter、letter、句読点、combining_spacing_mark、final_quote_punctuation、空白]"}、"ステータス":400}

ローマ数字を単語にトークン化するにはどうすればよいですか?

4

1 に答える 1