Solrcloud の新機能の使用方法を学んでおり、Zookeepers のアンサンブルとシャード インデックス用の一連の Solr インスタンスを正常にセットアップできます。障害がセットアップにどのように影響したかを調査したかったのです。ほとんどの場合、1 つのケースを除いて、期待どおりに機能しました。
私は 2 台のマシンを使用し、それぞれで 3 つの Zookeepers を開始しました (合計 6 つ)。1 つのマシン (bosmac01) で s Solr インスタンスを開始し、2 つのシャードを要求し、そのマシンで 2 番目のインスタンスを開始しました。次に、2 台目のマシン (qasolrmaster) でさらに 2 つの Solr インスタンスを開始しました。Solr 管理者は、私が期待した構成を示し、インデックス作成/クエリは機能しました。
Shard1: qasolrmaster:8900 および bosmac01:8983 Shard2: qasolrmaster:8910 および bosmac01:8920
1 台のマシンがクラッシュした場合にどうなるかをテストしたかったので、qasolrmaster をシャットダウンしました。3 つの Zookeeper がまだ実行中であり、各シャードにまだ Solr インスタンスが接続されているため、すべてが機能することを期待していました。代わりに、残りの 2 つの Solr インスタンス (bosmac01 上) が、不足している Zookeeper への再接続を試行し続けました。管理者はクラウド イメージを表示せず、ドキュメントやクエリを追加できませんでした。qasolrmaster ですべての Zookeeper を停止し、マシンを実行したままにすると、同じことが起こります。行方不明の飼育係の 1 つを再起動すると、正常に戻りました。
なぜテストが失敗したのですか?3 つの ZooKeeper と各シャードに 1 つの Solr があれば、作業を続けることができますよね?