以下のようにトークン文字を登録してトークナイザーを作成すると、Roman 'X' が登録できません。 (Test ES Version : ES6.7, ES5.6)
"tokenizer": {
"autocomplete": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 14,
"token_chars": [
"Ⅹ"
]
}
}
エラーログはこんな感じ
{"error":{"root_cause":[{"type":"remote_transport_exception","reason":"[node02][192.168.115.x:9300][indices:admin/create]"}],"type ":"illegal_argument_exception","reason":"不明な トークン タイプ: 'ⅹ'、[symbol、private_use、paragraph_separator、start_punctuation、unassigned、enclosing_mark、connector_punctuation、letter_number、other_number、math_symbol、lowercase_letter、space_separator、surrogate、のいずれかである必要があります。 initial_quote_punctuation、decimal_digit_number、digit、other_punctuation、dash_punctuation、currency_symbol、non_spacing_mark、format、modifier_letter、control、uppercase_letter、other_symbol、end_punctuation、modifier_symbol、other_letter、line_separator、titlecase_letter、letter、句読点、combining_spacing_mark、final_quote_punctuation、空白]"}、"ステータス":400}
ローマ数字を単語にトークン化するにはどうすればよいですか?