3

基本一致クエリ: Billy Sue

テスト マッチ クエリ #1: Billy Sue と

テスト マッチ クエリ #2: Billy と Sue

最終的に Base と #1 のスコアは同じになりますが、Base と #2 のスコアは似ていますが異なるものです。

分析 API を使用すると、and両方のテスト クエリでストップ ワードが削除されますがSue、ベース クエリとテスト クエリ #2 では start_offset および end_offset トークン プロパティが異なります。

基本的に、残りのトークン間のストップワード除去前の距離が記録され、スコアリングに小さいながら有限の影響を与えます。

質問

start_offsetストップ ワードが削除されるまで、トークンのおよびプロパティの計算を遅らせる方法はありend_offsetますか。そうでなければ、削除されたストップ ワードが何らかの方法でスコアリングに影響を与えないようにする方法はありますか?

4

1 に答える 1

3

おそらく、ストップ ワード フィルターの位置の増分 を無効にして、それが役立つかどうかを確認してください。特に、マッピングにストップ ワード フィルターの後に何らかのフィルターがある場合、位置の増分から奇妙なアーティファクトが得られます。

たとえば、次のようなものです。

"analyzer": {
   "analyzer_example":{
      "tokenizer":"standard",
      "filter":["standard", "lowercase", "filter_stop"]
    }
},
"filter": { 
   "filter_stop":{
      "type":"stop",
      "enable_position_increments":"false"
    }
}
于 2013-01-23T16:19:27.060 に答える