問題タブ [solr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2702 参照

solr - Solr と SolrJ の範囲クエリについて質問がありますか?

インデックスに title、x、y の 3 つのフィールドがあるとします。

1つの範囲(10 < x < 100)が次のようにクエリできることを知っています:

http://localhost:8983/solr/select?q=x:[10 から100]&fl=タイトル

2 つの範囲 (10 < x <100 AND 20 < y < 300) が必要な場合は、次のようにクエリを実行します。

SQL (x>10 かつ x < 100 かつ y > 20 かつ y < 300 のタイトルを選択)

Solr範囲クエリまたはSolrJを使用していますが、これを実装する方法がわかりません。他の誰かが知っていますか?ありがとう

メールアドレス: enzhaohoo@gmail.com

0 投票する
2 に答える
4056 参照

parsing - 用語抽出: テキストからタグを生成

http://developer.yahoo.com/search/content/V1/termExtraction.htmlと同じ結果を得る方法

この質問は、以前にかなりの回数尋ねられました。

既存のソリューションでこの問題にアプローチしようとすると、「テキスト分析」Solr は、http: //wiki.apache.org/solr/AnalyzersTokenizersTokenFilters で説明されているように、インデックスを作成する前にドキュメントに対して実行します。これには、ステミングも含まれます。

そのため、最終的な索引は、ドキュメントを説明するために使用される用語の大部分で構成されます。

直接使用するためのアナライザー、トークナイザー、およびトークン フィルターを提供するソリューションはありますか? solrが解決策である場合、solrのインデックスからこのデータを取得する最良の方法は何ですか?

0 投票する
6 に答える
1129 参照

python - 検索文字列をPythonのコンテンツに一致させる方法

通常、検索するときは、ストーリーのリストがあり、検索文字列を提供し、指定された検索文字列がストーリーと一致する結果のリストを期待します。

私がやろうとしていることは、その反対です。検索文字列のリストと1つのストーリーを提供し、どの検索文字列がそのストーリーに一致するかを調べます。

これはreで実行できますが、ここでのケースは、solrでサポートされている複雑な検索クエリを使用したい場合です。クエリ構文の詳細については、こちらをご覧ください。注:ブーストは使用しません。

基本的に、以下のサンプルコードでdoisitmatch関数のポインタを取得したいと思います。

編集:さらに、以下のようなluceneクエリを正規表現に変換するモジュールが存在するかどうかを知りたいと思います。

0 投票する
1 に答える
1321 参照

solr - SolrJ 範囲クエリについて質問がありますか?

http://localhost:8983/solr/select?q=queryStr&fq=x:[10 TO 100] AND y:[20 TO 300] or : http://localhost:8983/solr /select?q=クエリ文字列&fq=x:[10 から100]&fq=y:[20 から 300]

solrJ を使用してこの範囲クエリを作成する方法は?

0 投票する
2 に答える
4449 参照

ruby-on-rails - solrサニタイズクエリ

RailsでRubyを使用したSolrを使用しています。それはすべてうまく機能しています。ユーザー入力をサニタイズするための既存のコードがあるかどうかを知る必要があります。たとえば、?で始まるクエリなどです。また *

0 投票する
1 に答える
1212 参照

lucene - Solrの地理的位置を使用したランキング

Solr / Luceneのカスタムランキングアルゴリズムを実装する正しい方法は何ですか?

特定の地域のイベントに対応するドキュメントに距離加重ランキングシステムを実装するZventsについて読みました(http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Zvents)。

同様のことをしたいと思います。さまざまな都市の広告にインデックスを付け、特定の場所にある最も近い広告の関連性を高めたいと考えています。

0 投票する
1 に答える
853 参照

glassfish - centOSを使用してGlassfishでsolr.homeを設定するにはどうすればよいですか?

Glassfishをsolr検索サーバーとして使用したいのですが、centOSを使用してGlassfishでsolr.homeを設定する方法がわかりません。solr.homeを設定しようとしましたが、機能しませんでした。エラーは次のとおりです。「solr.xmlを探しています:/var/deploy/solr/solr.xml」

0 投票する
2 に答える
5150 参照

lucene - Solr を使用したセマンティック分析

Solr インストールにセマンティック分析を追加することを検討していますが、どこから始めればよいか正確にはわかりません。

基本的に、Solr が「類似した」単語 (索引付けされた文書の本文から取得) を見つけられるようにしたいと考えています。たとえば、「音楽」を検索すると、セマンティック エンジンにクエリを実行して、「ロック」、「ポップ」などを取得できるはずです (もちろん、これらの単語がインデックス付きドキュメントの一部で音楽に近い場合)。

このプロジェクトを見つけましたが、開始するのに適切な場所かどうかわかりません: http://code.google.com/p/semanticvectors/

0 投票する
4 に答える
5158 参照

python - Python のメモリ フットプリントとヒープ サイズ

Python スクリプトを使用して大規模なsolrクエリを発行しているときに、メモリの問題が発生しています。solrpyライブラリを使用して、solr サーバーとやり取りしています。クエリは、約 80,000 レコードを返します。クエリを発行した直後に、上部のバルーンから見た Python のメモリ フットプリントは最大 190 MB です。

この時点で、heapy から見たヒープ プロファイルは次のようになります。

Unicode オブジェクトは、クエリからのレコードの一意の識別子を表します。注意すべきことの 1 つは、Python が 190MB の物理メモリを占有しているのに対し、合計ヒープ サイズはわずか 14MB であることです。クエリ結果を格納する変数が範囲外になると、ヒープ プロファイルはガベージ コレクションを正しく反映します。

ただし、メモリ フットプリントは変更されません。

Python の物理メモリ フットプリントと Python ヒープのサイズに大きな違いがあるのはなぜですか?

0 投票する
5 に答える
50208 参照

solr - java RuntimeExceptionを修正する方法:リソース'solrconfig.xml'が見つかりませんか?

SolrサーバーOSとしてUbuntu8.10を使用し、次のように設定しました。

Tomcatを実行すると(Windows XPで実行して使用したTomcatとSolrは問題ありませんが、次のようなエラーが発生します:

誰かがその方法を知っていますか?