問題タブ [solrcloud]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2027 参照

solr - solrcloud レプリカ待機時間の構成

2 シャード 2 レプリカ構成で solrcloud クラスターをセットアップしました。しかし、シャード ノードを開始し、各シャードに 1 つのレプリカ ノードのみを開始すると、シャード リーダー ノードは継続的にメッセージを出力します: waiting until we see more replicas up,total 3 found 2 timeoutin 175000、他のレプリカがここに来るまでの待機時間は約 3 分です。

私の質問は、開発をスピードアップするために、この待機時間を短縮する方法ですか?

0 投票する
1 に答える
799 参照

solr - SolrCloud - シャード数のベスト プラクティス

不必要に多くのシャードを作成せずにシステムを拡張できるように、システム内のシャード数を計画する方法に関するベスト プラクティスの優れた情報源はありますか? シャードが多すぎると複雑さが増し、ある時点でパフォーマンスに影響を与える可能性さえあります

過去にその問題についていくつかの質問がありましたが、具体的な提案はありませんでした.

0 投票する
2 に答える
663 参照

solr - リーダーでのみデータインポートを実行するように CloudSolrServer を作成する

SolrCloud を使用して 2 つのサーバーの Solr クラスターをセットアップしました。現在、マスターとレプリカがあります。

スレーブでデルタインポートを行うのは意味がないため、データインポートをリーダーに渡したいです(更新はリーダーに配布されません)。

ドキュメントから、CloudSolrServer はクラスターの状態 (Zookeeper から取得) を認識しており、デフォルトではすべての更新をリーダーにのみ送信することがわかりました。

私が望むのは、CloudSolrServer がすべての dataimport コマンドをマスターに送信するようにすることです。次のコードがあります。

しかし、リクエストは引き続き私のサーバー localhost:8080 と localhost:8983 の両方に送信されます。これを修正する方法はありますか?

0 投票する
1 に答える
6555 参照

solr - SolrCloud vs Solr マスター/スレーブ レプリケーション

今週、Solr インデックスで問題が発生しました: http://lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html

今日、そのエラーはほぼすべてのリクエストで常に発生し始め、バグだと思ったのでJIRAの問題を作成しましたhttps://issues.apache.org/jira/browse/SOLR-4707

ご覧のとおり、最終的には Solr マスター/スレーブ レプリケーションの失敗が原因でした。Solr マスター/スレーブ レプリケーションは私たちの環境に合わないように見えるため、SolrCloud への移行を検討する必要があるかどうかはわかりません。要件:

  • インデックス サイズ: ~2,000 万ドキュメント、~9GB
  • ~1200 更新/分
  • ~10000 クエリ/分 (2 つのスレーブに分散) MoreLikeThis、RealTimeGet、TermVectorComponent、SearchHandler

誰かがこれらの質問に答えるのを手伝ってくれるなら、私は感謝します:

  • SolrCloud に移行することをお勧めしますか? レプリケーションのパフォーマンスに影響はありますか?
  • その場合、どちらがより優れたパフォーマンスを発揮しますか? すべてのサーバーでインデックスのコピーを維持するか、シャード サーバーを使用しますか?
  • 高可用性を確保するには、いくつのシャードとレプリカを推奨しますか?

敬具、

ビクター

0 投票する
1 に答える
2883 参照

solr - Solrj クライアントと XML 応答

jetty サーバーで solr4.0 を使用しています。solrj を使用して solr にクエリを実行し、結果が XML でフォーマットされることを期待しています。そこで、HttpSolrServer を使用し (CloudSolrServer と LBHttpSolrServer はパーサーの設定をサポートしていません)、パーサーを Xmlparser に設定しました。さらに、SolrQuery param wt=xml も設定していますが、XML で結果を取得できません。テスト コードは次のとおりです。

ここで何がうまくいかないのですか?

0 投票する
1 に答える
1580 参照

solr - AWS EC2 マシンでの Solrcloud 構成

AWS EC2 マシンでの SolrCloud のセットアップで問題に直面しています。シナリオは次のとおりです。

Zookeeper と solr 用に 3 つのサーバーがあります。

各サーバーには、Zookeeper が実行されています。Zookeeper のホスト情報を使用して Solr を起動すると、Solr が起動し、期待どおりに動作します。

問題は、クラスター情報を生成するときに飼育係がサーバーのプライベート IP を使用するため、プライベート IP を認識できない Solrj を使用してクエリを実行できないことです。たとえば、server1 の場合。private IP ip-a,b,c,d public IP : u,v,w,x Zookeeper は、プライベート IP によって solr インスタンスを認識します (明らかに、これは外部の EC2 マシンからは見えません)。

ライブ ノード IP はプライベート IP であり、パブリック IP ではありません

Zookeeper がクラスター情報を IP ではなくホスト名として保存する方法はありますか? それができない場合、AWS EC2 マシンで solr Cloud を実行するにはどうすればよいですか?

0 投票する
2 に答える
1210 参照

solrcloud - Solr クラウドでの Solr コアの作成 (solr 4.1.0)

2 つのシャードを持つ solr クラウドで Java アプリケーションを使用して動的にコアを作成しようとしています。

ただし、次のエラーが表示されます: 指定された構成は ZooKeeper:mycore に存在しません

solr 管理コンソールを確認したところ、コレクション「mycore」が完全に作成されておらず [つまり、フォルダー シンボルがない]、「mycore」という名前の構成がないことがわかりました。

どうすればこの問題を解決できますか。2 シャード solr クラウド (solr 4.1.0) でコアを動的に作成する標準的な方法は何ですか?

0 投票する
1 に答える
136 参照

solr - 互換性のあるコレクション - SOLR 4 / SOLRCloud

次のクエリを実行できるようにするために、互換性のあるコレクションによって SOLR が何を意味するのかを理解しようとしています。

Query all shards of multiple compatible collections, explicitly specified:

http://localhost:8983/solr/collection1/select?collection=collection1_NY,collection1_NJ,collection1_CT

これは、schemas.xml がそれらのコレクション間で完全に同じでなければならないということですか、それとも部分的に同じでなければならない (クエリを満たすために使用される同じフィールドを共有する) ということですか?

乾杯、/マルシン

0 投票する
1 に答える
108 参照

apache - apache solr csvファイルの同じ値

私たちは、問題の解決策として Apache Solr を特定しました。ご容赦ください。私は Apache Solr を初めて使用します。いくつかの大きな CVS ファイルをアップロードし、Solrs REST のような機能を使用して結果を XML/JSON に戻すことを計画しています。

私が考えている問題は、たとえば、currency.csv と country.csv の 2 つのファイルがあり、両方に通貨エントリとして「GBP」があることです。これらの両方のファイルを Solr にアップロードし、「GBP」の値に対してクエリを実行すると、どのファイル エントリが返されるのでしょうか?

私が理想的にやりたいことは、country.csv ファイルではなく currency.csv からアップロードされた「GBP」フォーム エントリなど、通貨のみを返すクエリです。

同様のデータを含むファイルがある可能性があるため、誰かが助けてくれるか、正しい方向に向けてくれることを願っていますが、正しいcsvファイルから正しい値を確実に取得する必要があります。

前もって感謝します。GM

アップデート

複数のコアを持っている方が良いですか?つまり、ファイルごとに 1 つのコアですか?

0 投票する
1 に答える
684 参照

solrcloud - SolrCloud サーバーの再起動がハングする

私は SolrCloud を 2 つのシャード (レプリカなし) で使用しており、両方とも同じマシンで実行しています。別の Zookeeper インスタンスを使用しています。私が直面している問題は、サーバーを再起動すると、SolrCloud が起動に失敗することです。

最初のシャードにログイン: 2013 年 5 月 23 日午後 3:10:53 org.apache.solr.core.CachingDirectoryFactory close INFO: ディレクトリの解放:/opt/solr-4.1.0/example/solr/my-collection/data May 2013 年 5 月 23 日 3:10:53 PM org.apache.solr.core.CachingDirectoryFactory close INFO: ディレクトリの解放:/opt/solr-4.1.0/example/solr/my-collection/data/index 2013 年 5 月 23 日 3: 11:01 PM org.apache.solr.common.cloud.ZkStateReader$3 プロセス情報: ライブ ノードを更新しています... (2)

2 番目のシャードにログインします。 23、2013 3:11:09 PM org.apache.solr.core.CachingDirectoryFactory close INFO: ディレクトリの解放:/opt/solr-4.1.0/example2/solr/my-collection/data/index

サービスを開始するには、SolrCloud シャードのデータ フォルダー全体を削除して、もう一度開始する必要があります。tlog フォルダーだけを削除しても効果はありません。これを防ぐ方法はありますか。