-1

CentOs 6 を搭載した vagrant マシンに sphinx がインストールされており、Snowball からオランダ語の libstemmer をインストールしようとしています。インストールは正常に実行されましたが、テストはうまくいきません。

まったく同じデータで 2 つのインデックスを作成しました。私のインデックスは次のとおりです。

index shop_products1 {
  type = rt
  dict = keywords
  min_prefix_len = 3
  rt_mem_limit = 2046M

  path = /var/lib/sphinxsearch/data/shop_products2

  morphology = libstemmer_nl, stem_en
  
  html_strip = 1
  html_index_attrs = img=alt,title; a=title;

  preopen = 1
  inplace_enable = 1
  index_exact_words = 1

  
  rt_field = name
  rt_field = brand
  rt_field = description
  rt_field = specifications
  rt_field = tags
  rt_field = ourtags
  rt_field = searchfield
  rt_field = shop
  rt_field = category
  
  rt_field = color
  rt_field = ourcolor
  rt_field = gender
  rt_field = material

  rt_field = ean
  rt_field = sku

  rt_attr_string = ean
  rt_attr_string = sku
  rt_attr_float = price
  rt_attr_float = discount
  rt_attr_uint = shopid
  rt_attr_uint = itemid
  rt_attr_uint = deleted
  rt_attr_uint = duplicate
  rt_attr_uint = brandid
  rt_attr_uint = duplicates
  rt_attr_timestamp = updated_at
}

index shop_products2 {
  type = rt
  dict = keywords
  min_prefix_len = 3
  rt_mem_limit = 2046M

  path = /var/lib/sphinxsearch/data/shop_products20

  html_strip = 1
  html_index_attrs = img=alt,title; a=title;

  preopen = 1
  inplace_enable = 1
  index_exact_words = 1

  
  rt_field = name
  rt_field = brand
  rt_field = description
  rt_field = specifications
  rt_field = tags
  rt_field = ourtags
  rt_field = searchfield
  rt_field = shop
  rt_field = category
  
  rt_field = color
  rt_field = ourcolor
  rt_field = gender
  rt_field = material

  rt_field = ean
  rt_field = sku

  rt_attr_string = ean
  rt_attr_string = sku
  rt_attr_float = price
  rt_attr_float = discount
  rt_attr_uint = shopid
  rt_attr_uint = itemid
  rt_attr_uint = deleted
  rt_attr_uint = duplicate
  rt_attr_uint = brandid
  rt_attr_uint = duplicates
  rt_attr_timestamp = updated_at
}




searchd {
	listen = 127.0.0.1:9306:mysql41
  log = /var/log/sphinxsearch/searchd.log
  workers = threads
  binlog_path = /var/lib/sphinxsearch/rt-binlog

  read_timeout = 5
  client_timeout = 200
  max_children = 0
  	
  # 2 hours
  rt_flush_period = 7200
  pid_file = /var/run/searchd.pid
  
}

たとえば、オランダ語の「afzuigkappen」を検索すると、「afzuigkap」とまったく同じ結果が得られます

誰かがこの仕事を得る方法についての情報を教えてもらえますか? Ps。私の悪い英語でごめんなさい..

4

2 に答える 2

0

雪だるま式のオランダ語ステマーは、次のようafzuigkappenafzuigkap異なります。

afzuigkappen  -> afzuigkapp
afzuigkap -> afzuigkap

そのため、ステマー アルゴリズムを更新して、目標に到達する必要があります。アルゴリズムに関するドキュメントは こちら

于 2015-09-04T14:42:16.780 に答える