0

Solr を使用して複数単語のキーワード リストを実装する方法についての降下チュートリアルがあるかどうかを尋ねたいと思います。

私の入力データセットには、特定のトピックに関する複数のタイトルと説明が含まれています (例: "Mark Aurel")。タイトルと説明として、(wikipedia & co.) のような複数のソースがあり、タイトルは h1 と h2、説明はテキストです。ここで、これらのソースからのキーワードを表示したいと思います。タイトル>説明の重み付けよりも、ソースの優先度が最も高くなります。

キーワードは次のようになります。

「ローマ皇帝」「哲学者」…などなど

Aaswer が得られなかったので、このトピックについてもう少し詳しく説明します。入力データは php から配列として取得されます。

$input[0] = array ('id' => some_md5, 'title' => 'Title Nr. 1', 'desc' => 'Desc Nr.1', 'author' => 'Mark Aurel')
$input[1] = array ('id' => some_md5, 'title' => 'Title Nr. 2', 'desc' => 'Desc Nr.2', 'author' => 'Mark Aurel')

質問を部分に分解しましょう:

  1. 複数フィールドのファセット検索を行うにはどうすればよいですか。タイトルと説明について教えてください。
  2. キーワードリストの意味のある単語を取得するのに最適なアナライザーは何ですか?
4

1 に答える 1

0

一度に複数のフィールドに対してキーワードを検索するには、dismax/edismax を使用します: http://wiki.apache.org/solr/ExtendedDisMaxを参照してください。

qf パラメーターをこの例のように設定すると、qf=title^3 author^2 descタイトルと作成者のフィールドに、desc よりも重み/重要度が高くなります。

于 2012-10-24T00:18:40.397 に答える