全文検索にelasticsearchとglobalize gemsを使用していますが、チェコ語/英語のアナライザーを使用して、サプライヤー名、ローカライズされた説明を検索できると期待しています。
例: サプライヤー名: "Bonami.cz" サプライヤーの説明_CZ: "チェコ語でのテストの説明。"
「Bonami.cz」を検索すると機能しますが、検索すると機能しません (0 結果):
- 「ボナミ」(単語の一部)
- 「テスト」(説明)
ドキュメントに基づいて、以下の方法が機能するはずですが、明らかに何かを見逃しています。インデックスとデータが ElasticSearch にあることを確認しました。
また、モデルで使用する前に、チェコ語/英語のアナライザーを何らかの形でインストールする必要がありますか?
require 'elasticsearch/model'
require 'activerecord-import'
class Supplier < ActiveRecord::Base
after_commit lambda { __elasticsearch__.index_document }, on: :create
after_commit lambda { __elasticsearch__.update_document }, on: :update
translates :description, :fallbacks_for_empty_translations => true
accepts_nested_attributes_for :translations
include Elasticsearch::Model
include Elasticsearch::Model::Callbacks
include Elasticsearch::Model::Globalize::MultipleFields
mapping do
indexes :id, type: 'integer'
indexes :name, analyzer: 'czech'
indexes :description_ma, analyzer: 'czech'
indexes :description_cs, analyzer: 'czech'
indexes :description_en, analyzer: 'english'
end
def as_indexed_json(options={})
{ id: id,
name: name,
description_ma: description_ma,
description_cs: description_cs,
description_en: description_en
}
end
def self.search(query)
__elasticsearch__.search(
{
query: {
multi_match: {
query: query,
fields: ['name^10', 'description_ma', 'description_cs', 'description_en']
}
}
})
end
end
何が悪いのですか?ありがとう、ミロスラフ
更新 1 Rails 4 のソリューションである elasticsearch-rails に触発されましたが、今検索しようとすると、どの単語でも常に結果がゼロになります。
settings index: {
number_of_shards: 1,
analysis: {
filter: {
trigrams_filter: {
type: 'ngram',
min_gram: 2,
max_gram: 10
},
content_filter: {
type: 'ngram',
min_gram: 4,
max_gram: 20
}
},
analyzer: {
index_trigrams_analyzer: {
type: 'custom',
tokenizer: 'standard',
filter: ['lowercase', 'trigrams_filter']
},
search_trigrams_analyzer: {
type: 'custom',
tokenizer: 'whitespace',
filter: ['lowercase']
},
english: {
tokenizer: 'standard',
filter: ['standard', 'lowercase', 'content_filter']
},
czech: {
tokenizer: 'standard',
filter: ['standard','lowercase','content_filter']
}
}
}
} do
mappings dynamic: 'false' do
indexes :name, index_analyzer: 'index_trigrams_analyzer', search_analyzer: 'search_trigrams_analyzer'
indexes :description_en, index_analyzer: 'english', search_analyzer: 'english'
indexes :description_ma, index_analyzer: 'czech', search_analyzer: 'czech'
indexes :description_cs, index_analyzer: 'czech', search_analyzer: 'czech'
end
end
def as_indexed_json(options={})
{ id: id,
name: name,
description_ma: description_ma,
description_cs: description_cs,
description_en: description_en
}
end
def self.search(query)
__elasticsearch__.search(
{
query: {
multi_match: {
query: query,
fields: ['name^10', 'description_ma', 'description_cs', 'description_en']
}
},
highlight: {
pre_tags: ['<em>'],
post_tags: ['</em>'],
fields: {
name: {},
description_ma: {},
description_cs: {},
description_en: {}
}
}
}
)
end
特定のモデルのエラスティック検索 URL を開くと、次のように表示されます。
{"suppliers":{"aliases":{},"mappings":{"supplier":
{"dynamic":"false","properties":{"description_cs":
{"type":"string","analyzer":"czech"},"description_en":
{"type":"string","analyzer":"english"},"description_ma":
{"type":"string","analyzer":"czech"},"name":
{"type":"string","index_analyzer":"index_trigrams_analyzer","search_analyzer":"search_trigrams_analyzer"}}}},"settings":{"index":
{"creation_date":"1445797508427","analysis":{"filter":
{"trigrams_filter":
{"type":"ngram","min_gram":"2","max_gram":"10"},"content_filter":
{"type":"ngram","min_gram":"4","max_gram":"20"}},"analyzer":{"english":
{"filter":["standard","lowercase","content_filter"],"tokenizer":"standard"},"index_trigrams_analyzer":{"type":"custom","filter":["lowercase","trigrams_filter"],"tokenizer":"standard"},"search_trigrams_analyzer":{"type":"custom","filter":["lowercase"],"tokenizer":"whitespace"},"czech":{"filter":["standard","lowercase","content_filter"],"tokenizer":"standard"}}},"number_of_shards":"1","number_of_replicas":"1","version":
{"created":"1060099"},"uuid":"wX9kf3OQSva24Iwk7sZ8AQ"}},"warmers":{}}}
更新 2
期待どおりに動作させるには 2 つの手順がありません => 1. モデル データを再インポートする 2. 説明フィールドの名前のタイプミス (description_ma/en/cs ではなく、ma/cs/en_description.
settings index: {
number_of_shards: 1,
analysis: {
filter: {
trigrams_filter: {
type: 'ngram',
min_gram: 2,
max_gram: 10
},
content_filter: {
type: 'ngram',
min_gram: 4,
max_gram: 20
}
},
analyzer: {
index_trigrams_analyzer: {
type: 'custom',
tokenizer: 'standard',
filter: ['lowercase', 'trigrams_filter']
},
search_trigrams_analyzer: {
type: 'custom',
tokenizer: 'whitespace',
filter: ['lowercase']
},
english: {
tokenizer: 'standard',
filter: ['standard', 'lowercase', 'content_filter']
},
czech: {
tokenizer: 'standard',
filter: ['standard','lowercase','content_filter' ]
}
}
}
} do
mappings dynamic: 'false' do
indexes :name, index_analyzer: 'index_trigrams_analyzer', search_analyzer: 'search_trigrams_analyzer'
indexes :en_description, index_analyzer: 'english', search_analyzer: 'english'
indexes :ma_description, index_analyzer: 'czech', search_analyzer: 'czech'
indexes :cs_description, index_analyzer: 'czech', search_analyzer: 'czech'
end
end
def as_indexed_json(options={})
{ id: id,
name: name,
ma_description: ma_description,
cs_description: cs_description,
en_description: en_description
}
end
def self.search(query)
__elasticsearch__.search(
{
query: {
multi_match: {
query: query,
fields: ['name^10', 'ma_description', 'cs_description', 'en_description']
}
},
highlight: {
pre_tags: ['<em>'],
post_tags: ['</em>'],
fields: {
name: {},
ma_description: {},
cs_description: {},
en_description: {}
}
}
}
)
end