問題タブ [edismax]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - dismax と edismax は異なる結果を返します
私は自分のウェブサイトに Solr を使用しています。ドキュメントには、ジャンルとトピックの 2 つのフィールドがあります。たとえば、愛についての小説を検索したい場合、solr クエリは tyepDef=dismax&qf=genre,topic&q=genre:novel AND topic:about love になります。ただし、これは結果を返しません。ただし、edismax を使用すると、トピックが「about」で始まるすべてのドキュメントが返されます。これらは 2 つの異なる極端であり、何もないか、すべてです。ジャンル:小説とトピック:愛についての両方を満たすドキュメントが返されるように、クエリをどのように構成できますか?
solr - Lucene / SOLR インデックスで同様の結果を見つける
MS Word ドキュメントの大規模なコーパスに対するユーザーの選択にタグを付けるためのアプリケーションがあります。これらの選択には、1 つまたは複数のキーワード タグと、通常はタイトル タグを付けます。選択したテキストが即座に分析され、タガーに最も可能性の高いキーワードとタイトル タグのリストが表示される機能を追加したいと考えています (既存のタグ付きテキストの選択に基づく)。
SOLR インデックスを使用しています。選択したテキストをクエリ自体として発行するだけで、同様の選択を返すことができると言われました。ただし、選択したテキストの長さは 200 ~ 6000 語の間である可能性があります。6000 ワードのクエリは、メモリ使用量の問題になる可能性があります。
非常に積極的なストップワードの削除を行って、クエリ内の単語の数を大幅に減らし、非常に意味のある単語だけを残すことができると考えました。私たちは過去 10 年間このコーパスに取り組んできましたが、主題と使用されている語彙に精通しているため、これは簡単に行うことができます。しかし、問題は、通常のユーザーがインデックスを検索できるようにするために同じインデックスも使用していることです。一般的な単語を削除しすぎると、通常のクエリ (特にフレーズ クエリ) が正しく機能しない可能性があります。
また、ドキュメント全体に恣意的に広がるのではなく、より狭い範囲内にクエリのテキストを含む結果を増やしたいと考えています。
もう 1 つの問題は、ネストされた選択が許可されていることです。外側の選択は本質的により一般的で約 5000 語の長さである可能性があり、内側の選択はより短く、より具体的なトピックになります。ただし、両方の選択に同じテキストが含まれているため、SOLR は両方を高くランク付けしますが、外側の選択はあまり関連性がない可能性があります
ここ数日、SOLR クエリ パーサーのドキュメントを調べてきましたが、これは実行可能であるように見えますが、これを機能させるために何をする必要があるのか、まだ正確にはわかりません。どんな提案でも大歓迎です。
solr - Solr edismax クエリ パーサー オペレーター
edismax パーサーについて 2 つのクエリがあります --->
1.edismax パーサーは && || をサポートしていますか? AND および OR 演算子の場合は? 2.また、NOT 演算子 like および/または AND/OR の 'not' はサポートされていますか?
edismax パーサーがこれをサポートしていない場合、このパーサーを拡張してこの機能を追加するにはどうすればよいですか?
前もって感謝します。デヴェンドラ
solr - solr の計算フィールド ノルムは、異なるサイズのフィールドでも同じです
Solr で 2 つのドキュメントを作成しました。
フィールド「タイトル」は、schema.xml で次のように定義されています。
"journal of neurology"というクエリを使用すると、両方のドキュメントのスコアは同じですが、2 番目のドキュメントの方が正確です。フレーズ クエリを指定しても問題は解決しません。また、計算されたfieldNorm が両方のドキュメントで「0.5」であることもわかります。これは、長さのノルムを 1 バイトに格納するときに精度が失われることと関係がありますか?
以下は、提供されているすべてのパラメーターです (solrconfig.xml のデフォルト)。
スコアの計算を見ると、それらの間に単一の違いは見られません
fieldNorm が両方のドキュメントで同じである理由は何ですか?
前もって感謝します!
solr - solr dismax クエリが空の結果セットを返すのはなぜですか?
Dismaxクエリパーサーを使用してsolr 4.5でインデックス付きデータからフリーテキスト検索結果を取得しようとしていますが、次のような単純なクエリでは結果が返されず、エラーもありません。
そして、これらのドキュメントはインデックスに存在します:
私のschema.xmlは次のとおりです。
およびsolrconfig.xmlで
何が間違っているのでしょうか?なぜ結果が出ないのですか?
solr - eDismax を使用した近接検索
solr を使用して検索エンジンを作成しました。ユーザーが「 college 」という単語を検索すると、「有名な」という単語が近接しているドキュメントのスコアが得られるようなクエリを作成したいと考えています(2 単語以内、つまり「有名な大学」または「大学は有名です」)。もっと高いべき。有名な単語が近接して存在しない場合、「大学」という単語のみに基づいてスコアを計算する必要があります。
私が欲しいのは、この「有名な大学」〜2 ^ 10 OR「有名な大学」〜1 ^ 10 OR「大学」のようなものです
eDismaxでこれを達成する方法は?