今週、Solr インデックスで問題が発生しました: http://lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html、
今日、そのエラーはほぼすべてのリクエストで常に発生し始め、バグだと思ったのでJIRAの問題を作成しましたhttps://issues.apache.org/jira/browse/SOLR-4707
ご覧のとおり、最終的には Solr マスター/スレーブ レプリケーションの失敗が原因でした。Solr マスター/スレーブ レプリケーションは私たちの環境に合わないように見えるため、SolrCloud への移行を検討する必要があるかどうかはわかりません。要件:
- インデックス サイズ: ~2,000 万ドキュメント、~9GB
- ~1200 更新/分
- ~10000 クエリ/分 (2 つのスレーブに分散) MoreLikeThis、RealTimeGet、TermVectorComponent、SearchHandler
誰かがこれらの質問に答えるのを手伝ってくれるなら、私は感謝します:
- SolrCloud に移行することをお勧めしますか? レプリケーションのパフォーマンスに影響はありますか?
- その場合、どちらがより優れたパフォーマンスを発揮しますか? すべてのサーバーでインデックスのコピーを維持するか、シャード サーバーを使用しますか?
- 高可用性を確保するには、いくつのシャードとレプリカを推奨しますか?
敬具、
ビクター