1

干し草の山のデフォルト設定を非常に単純なものに変更しようとしています。

'settings': {
  "analyzer": "spanish"
}

インデックスを再構築した直後に表示されます。

$ curl -XGET 'http://localhost:9200/haystack/_settings?pretty=true'
{
  "haystack" : {
    "settings" : {
      "index.analyzer" : "spanish",
      "index.number_of_shards" : "5",
      "index.number_of_replicas" : "1",
      "index.version.created" : "191199"
    }
  }

ただし、いくつかのストップワードでテストすると、期待どおりに機能しないため、「esto」と「que」を除外し、代わりに英語のストップワードから「is」と「a」をフィルタリングします。

$ curl -XGET 'localhost:9200/haystack/_analyze?text=esto+is+a+test+que&pretty=true'
{
  "tokens" : [ {
    "token" : "esto",
    "start_offset" : 0,
    "end_offset" : 4,
    "type" : "<ALPHANUM>",
    "position" : 1
  }, {
    "token" : "test",
    "start_offset" : 10,
    "end_offset" : 14,
    "type" : "<ALPHANUM>",
    "position" : 4
  }, {
    "token" : "que",
    "start_offset" : 15,
    "end_offset" : 18,
    "type" : "<ALPHANUM>",
    "position" : 5
  } ]

そして、クエリでアナライザを指定した場合にのみ機能します。

$ curl -XGET 'localhost:9200/haystack/_analyze?text=esto+is+a+test+que&analyzer=spanish&pretty=true'
{
  "tokens" : [ {
    "token" : "is",
    "start_offset" : 5,
    "end_offset" : 7,
    "type" : "<ALPHANUM>",
    "position" : 2
  }, {
    "token" : "test",
    "start_offset" : 10,
    "end_offset" : 14,
    "type" : "<ALPHANUM>",
    "position" : 4
  } ]

私が間違っていることについて何か考えはありますか?

ありがとう。

4

2 に答える 2

1

そのはず

"settings": {
    "index.analysis.analyzer.default.type" : "spanish"
}
于 2012-11-26T21:59:52.640 に答える
1

そして、それを「干し草の山」のインデックスだけに適用するには、次のようにします。

{
  "haystack" : {
    "settings" : {
      "index.analysis.analyzer.default.type" : "spanish",
  }
}

彼の提案をしてくれたimotovに感謝します。

于 2012-11-27T09:02:18.700 に答える