SOLRには、フィールドを持つドキュメントがありid, words (indexed), raw_text
ます。この方法でフィールドだけを検索したいwords
:単語は記事の不定詞です(またはキーワードを言います)。構文解析とレンマ化(ステミング)には別のツールを使用するので、それは問題のポイントではありません。
例:これらの2つの記事(テキスト)の場合、単語は次のようになります。
1昨日は休日だったので、出勤しませんでした。
言葉:昨日は休日なので仕事に行く
2明日は朝仕事をし、夕方は買い物に行きます。
言葉:明日は仕事に行く朝夕は店に行く
3つ の言葉:明日の仕事に行く
「go」の検索では、「go」が1より多いため、最初に2を取得します(より関連性が高くなります)。また、私はたくさんの単語でより長いクエリを使用したいと思っており、それらのほとんどを含む記事をほとんどの場合取得しています。
例:検索:「gotomorrow work」は、 3つに1つだけではなく、2つの「go」があるため、 3よりも関連性の高い2を返します。
だから質問:どのように保存する必要がありwords
ますか?multiValuedまたは単にsingle?どのフィールドタイプを使用する必要がありますか?
ありがとうございました!