問題タブ [elasticsearch-analyzers]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - Elasticsearchで音声検索よりも正確な検索に高いスコアを与える方法は?
現在、Elasticsearch の音声分析ツールを使用しています。クエリで、音声一致よりも完全一致に高いスコアを与えるようにしたい。私が使用しているクエリは次のとおりです。
を検索するAbhijeet
と、上位のクエリはAbhijit
であり、後でのみ表示されAbhijeet
ます。完全一致が最初に表示され、常に表示され、次に音声一致が表示されるようにします。これはできますか?
編集:
マッピング
音声アナライザーをセットアップするために使用したコードは次のとおりです。
title
ここで、とcontent
フィールドのみをクエリしたいと思います。ここでは、完全一致が最初に表示され、次に音声一致が表示されるようにします。
elasticsearch - ElasticSearchでローマ数字の用語をトークン化する方法は?
以下のようにトークン文字を登録してトークナイザーを作成すると、Roman 'X' が登録できません。 (Test ES Version : ES6.7, ES5.6)
エラーログはこんな感じ
{"error":{"root_cause":[{"type":"remote_transport_exception","reason":"[node02][192.168.115.x:9300][indices:admin/create]"}],"type ":"illegal_argument_exception","reason":"不明な トークン タイプ: 'ⅹ'、[symbol、private_use、paragraph_separator、start_punctuation、unassigned、enclosing_mark、connector_punctuation、letter_number、other_number、math_symbol、lowercase_letter、space_separator、surrogate、のいずれかである必要があります。 initial_quote_punctuation、decimal_digit_number、digit、other_punctuation、dash_punctuation、currency_symbol、non_spacing_mark、format、modifier_letter、control、uppercase_letter、other_symbol、end_punctuation、modifier_symbol、other_letter、line_separator、titlecase_letter、letter、句読点、combining_spacing_mark、final_quote_punctuation、空白]"}、"ステータス":400}
ローマ数字を単語にトークン化するにはどうすればよいですか?