現在、120 GB の入力データのインデックスが作成されています (データの保存ではなく、ドキュメント ID とインデックスのみ)。完全なデータ セットのインデックス作成には 12 時間以上かかります。
私たちはまだそれを本番環境に移行していません。私が知りたいのは、インデックスを複数のサーバーに分割してシャーディングを検討し始める必要があるのはいつですか?
インデックスのシャーディングはインデックス サイズの問題ですか、それとも単にインデックス作成時間/ディスク容量/ユーザー負荷の問題ですか?
インデックスが 200 GB、入力データが 300 GB などになると、メモリの制限が発生しますか?