solr で検索エンジンを構築し、クローラーとして Nutch を実行します。約 1300 万のドキュメントのインデックスを作成する必要があります。このジョブには 3 つのサーバーがあります。
- 4 コア Xeon 3Ghz、20Gb RAM、1.5Tb sata
- 2*4 コア Xeon 3Ghz、16Gb RAM、500Gb IDE
- 2*4 コア Xeon 3Ghz、16Gb RAM、500Gb IDE
1 台のサーバーをクロールとインデックス作成のマスターとして使用し、他の 2 台を検索用のスレーブとして使用するか、1 台を検索用に使用し、別の 2 台を 2 つのシャードのインデックス作成用に使用できます。どのアーキテクチャを推奨できますか? シャーディングを使用する必要があるか、シャードの量、およびどのサーバーを何に使用する必要がありますか?