問題タブ [solrj]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - solrによるインデックス作成後のメモリからの自動削除
メモリ不足のため、solr に強制的にインデックスをハード スペースに書き込み、ファイルをメモリ内で開いたままにしないようにしたいのですが、solrj でそれを行うにはどうすればよいですか? 各ドキュメントのインデックス作成後に solr.commit() を追加しますが、機能しません
solr - solr のメモリー管理と JVM 設定
大容量のデータ ストレージ (約 500 GB の PDF ファイルとビデオ ファイル) があり、マシンには 4 GB の RAM 容量があります。solrj API を使用してこれらのファイルにインデックスを付けたいのですが、ヒープ サイズの問題などを無視するために solrconfig と JVM に必要な設定は何ですか?インデックス作成中にメモリがクラッシュしますか? インデックス作成中にガベージコレクターにメモリの割り当てを解除させる構成はありますか?
ありがとう
mysql - SolrのみとSolr/MySQLソリューション
現在、私はSolrのみに基づいたシステムを持っています。つまり、他のデータストアを使用せずに(SolrJを使用して)すべてのデータをSolrに保存します。問題は、パフォーマンスの問題が発生することです。MySQLに保存してから、 DataImportHandlerなどを使用してSolrとデータを同期するのが理にかなっているのではないかと思いました。そのため、Solrインデックスの読み取り操作と、MySQLの主な書き込み操作があり、Solrと同期するときにSolr書き込み操作のみが行われることもあります。
重要なのは、何億ものドキュメントを保存する必要があることを期待していることですが、MySQL / Solrが理にかなっているのであれば、今はそうは思いません。
別のより良い解決策はありますか?たぶん、Master-Solrは書き込み用で、Solr-slavesは読み取り用ですか?
更新:私が言い忘れたのは、schema.xmlが変更された場合でも、「MySQLにデータを保存する」ソリューションが役立つ可能性があるということです。そうすれば、Solrの自己を気にせずにすべてのデータを再コミットできるからです。 -保存されたデータ。
solr - solrj でドキュメント フィールドを更新する
著者名を編集するなど、solr にファイルされたドキュメントを編集したいので、solrj で次のコードを使用します。
しかし、スキーマ内の著者 multivalued="true" とそのため、「anaconde」は以前の名前に置き換えられず、著者名の最後に追加されます。また、複数値フィールドを省略したり、false に設定したりすると、不正な要求例外が発生します。新しい作成者フィールドでファイルを再インデックスする際に発生します。どうすればこの問題を解決し、solrj の以前のドキュメント フィールドを削除または変更できますか? または、スキーマで見逃している設定はありますか? ありがとう
java - 1つのSolr-index-documentに複数の検索可能なファイルを追加する
抽出ハンドラーを使用して、複数のファイル(2つのPDFと1つのドキュメントなど)を1つのsolr-index-docに追加する方法またはベストプラクティスはありますか?クエリを実行したときの結果は、次のようになります。
私のJavaアプリケーションでは、1つのファイルのみを追加するようなファイルをSolr-Indexに追加しています。
java - Solr: ドキュメントが存在するかどうかを判断する
私は SolrJ の初心者で、一意の ID を持つドキュメントが存在するかどうかを判断する最速の方法を知りたいですか? ドキュメントは必要ありません。既にインデックスにあるかどうかを確認したいだけです。
今、SolrJで次のようなことを試しています:
スコアリングなどを必要としない、より良い(より速い?)方法があると思います...
solr - 順序付き近接検索
順序付きとは、ドキュメント内で term1 が常に term2 の前に来ることを意味します。
2 つの文書があります: 1. 「順序付きとは、文書内で term1 が常に term2 の前に来ることを意味します」 2. 「順序付きとは、文書内で term2 が常に term1 の前に来ることを意味します」
私がクエリを作成した場合:
私の結果は次のとおりです。2つのドキュメント
1 つの結果を取得するクエリを実行するにはどうすればよいですか (term1 が term2 の前にある場合のみ):
何か案は?
solr - SolrJで利用できる優れたチュートリアルまたはリソースはありますか?
私は仕事でApacheSolrサーバー用のJavaクライアントであるSolrJを使用しています。しかし、オンラインで利用できるリソースがほとんどないのを見るのはがっかりします。親サイトのウィキでさえ、一種の「初心者」ガイドです!
SolrJを使い始めることができるようなブログはほとんどありませんが、高度なものはありません。
SolrJと一緒に仕事をしたことがあり、その周りの貴重なリソースへのポインタを提供することで私を助けてくれる人がいるかどうかを確認したいと思います。
java - 大きな文字列を送信するときのContentStreamUpdateRequestソケット書き込みエラー
SolrJのContentStreamUpdateRequestを使用してsolrにデータを送信すると、次の例外が発生します
その例外の理由は、ドキュメントのバイナリデータをsolrに送信しているためです。これを削除すると、アプリケーションは正常に実行されます。次のコードを使用してリクエストを送信しています
文字列base64encodedFileはHTTPリクエストには長すぎると思いますが、その問題の解決策はわかりません。私の知る限り、Solrは構成ごとにドキュメントを保存できません。
java - DismaxRequestHandler で solrj を使用するには?
適切なドキュメントがないため、SolrJ で dismaxRequestHandler を使用する方法を理解できません。
別の注意として、標準のリクエストハンドラは SolrJ の実装のデフォルトですか?