問題タブ [solr4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - Solr - フラグメントのカスタマイズ
Solr の強調表示機能で Regexp Fragmenter を使用してフラグメントをカスタマイズしたいと考えています。
要件に従って、用語を強調表示する前後に 25 語を返す必要があります。
以下は、ハイライト フラグメントの 1 つのサンプルです。
Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.
そのために、以下の正規表現を作成しました
この正規表現は、単純な文字列で正常に機能します。(動作確認済) ですが、solrで使っているとうまく動かないようです。
うまくいくハイライトはほとんどありませんが、いくつかのハイライトの場合、ハイライト用語はハイライトフラグメントの最初に来ます。
私が必要としている正規表現フラグメンタができることはわかりません。そして、この要件を満たす他の方法はありますか。
誰でもこれについて私に提案できますか?
solr - エンドユーザーごとにsolrインデックスを分離する
私たちのアプリケーションでは、アプリケーションを使用して(アップロードされたデータのインデックスを作成するためにsolrを使用している)各ユーザーのインデックスデータを何らかの方法で分離したいと思います。それは可能ですか?
インデックス付けされるすべてのドキュメントのschema.xmlとドキュメント構造は同じです。セキュリティ上の理由から、分離したいだけです。
明確化:SolrにはWebアプリからのみアクセスできることを忘れました。エンドユーザーがSolrに直接接続することはありません。
solr - Solr でクエリが遅くなる。私のオプションは何ですか?
サーバー上で単一の Solr インスタンスを実行しています。このインスタンスのドキュメント数は、クエリが遅くなるポイントに達しています。私のオプションは何ですか?
solr - Solr full-import performance
I have a small set of queries and entities and even though the performance is pretty bad, I just would like to know what tricks and configurations that i can do to increase the performance ?
Note I'm using Solr 4.1.
solr - インデックス作成速度を向上させるために Solr を構成する方法
100万から5000万のSolrドキュメントを生成してSolrに追加するクライアントプログラムがあります。
クライアントからドキュメントをプッシュするために ConcurrentUpdateSolrServer を使用しています。リクエストごとに 1000 ドキュメントです。
ドキュメントは比較的小さい (小さなテキスト フィールドがほとんどない)。
割出し速度を上げたい。
「ramBufferSizeMB」を 1G に、「mergeFactor」を 25 に増やしてみましたが、変化は見られませんでした。
Solr のインデックス作成速度を向上させるために、他に推奨される設定があるかどうか疑問に思っていました。
関連資料へのリンクを歓迎します。
solr - jboss への接続を特定の IP アドレスに制限する
アプリケーションで Apache Solr を使用して、検索機能を提供しています。アプリケーションと一緒に solr.war ファイルを jboss にデプロイします。ただし、solr は jboss_host/solr URL から誰でもアクセスできるようになりました。
/solr/ がすべての IP アドレスからアクセスできないようにするにはどうすればよいでしょうか? 特定の IP アドレス、つまり jboss_host と他のいくつかの管理 API ホストに制限したいと考えています。
solr - Solr スペル チェッカー フィルター クエリ
Solrの上にスペルチェッカーを構築しようとしていました。基本情報は十分に良さそうですhttp://wiki.apache.org/solr/SpellCheckComponent#Introduction
どうにかしてスペル チェッカーの範囲を特定のクエリに制限できますか。たとえば、ジャンル=インターナショナルのスペルをスペルチェッカーに修正させたいとします。(ジャンルは、私の schema.xml で定義されたテキスト フィールドです)
編集
質問をより正確にするには: スペル チェッカー コンポーネントのクエリをフィルター処理するにはどうすればよいですか。fq=genre:music&query=jacksn
次に、スペル コレクターは、genre:music を持つドキュメントのみを調べる必要があります。
solr - LukeRequest をスペース、スラッシュ、コロンでエスケープする
Solr 4.1 を使用しています。LukeRequest を使用して、特定のフィールドのデータを含むドキュメントの数を取得したいと考えています。フィールドの名前は(とhttp://foo.org/bar/ baz
の間のスペースに注意してください) のようなものです。私が訪問すると、前述のフィールドを含むすべてのフィールドのリストが表示されます。私が訪問するときbar/
baz
http://127.0.0.1:8983/root/admin/luke
http://127.0.0.1:8983/root/admin/luke?fl=http://foo.org/bar/ baz
ヒットしません。文字列の URL エンコード、スラッシュのエスケープ、コロンのエスケープ、スペースのエスケープ、スペースの代わりに + の使用、考えられるすべてのバックスラッシュの組み合わせを試しました。solrの別の StackOverflow 質問フィールド リストに投稿された、間にスペースがあるフィールドの「fl」パラメーターを使用したソリューションは、私にとってはうまくいきませんでした。
私は本当に、ドキュメントがこの特定のフィールドに値を持っているかどうかについて、はい/いいえの答えを探しているだけなので、LukeRequest よりもこれを行うためのより良い方法があれば、私もそれを聞いています。
solr - Solr 4で結果を距離でソートする理想的な方法は?
Solr 4 での空間検索に関するこのドキュメントを読んで理解しようと懸命に努力しています。
http://wiki.apache.org/solr/SolrAdaptersForLuceneSpatial4
しかし、簡単な答えを見つけるのに苦労しています.Solr 4で結果を距離でソートする理想的な方法は何ですか?
ドキュメント セットで使用できる場所フィールドが 2 つあります。
geo
location_rpt
次のように定義されたフィールドです。
Andll
は、次のように定義された場所フィールドです。
上記の参照ドキュメントに表示されている例では、交差する円や、クエリで開始点 (lat/lng) を提供し、距離でソートされた結果のリスト。
更新:受け入れられた回答は、Solr 3 および 4 で機能する優れたソリューションを提供します。その回答に対する David Smiley のコメントは、厳密に「Solr 4」のソート方法を興味のある人に提供します。