大量のファイル (数千の異なるファイル、ファイルあたりの平均サイズは 2MB) を同時に処理する必要があります。
すべての情報は 1 台 (1.5 TB) のネットワーク ハード ドライブに保存され、約 30 台の異なるマシンからアクセス (読み取り) されます。効率を高めるために、各マシンは異なるファイルを読み取り (および処理) します (処理する必要があるファイルは数千あります)。
すべてのマシンは、1.5TB ハード ドライブの「incoming」フォルダからファイルを読み取った後、情報を処理し、処理された情報を 1.5TB ドライブの「処理済み」フォルダに出力する準備が整います。すべてのファイルの処理された情報は、入力ファイルとほぼ同じ平均サイズです (ファイルあたり約 2MB)。
そのような操作を構築するときに「すべきこと」と「してはいけないこと」はありますか? 30 台ほどのマシンが同じネットワーク ドライブに対して同時に情報を読み取る (または書き込む) ことは問題ですか? (注: 既存のファイルは読み取りのみで、追加/書き込みは行われません。新しいファイルは最初から作成されるため、同じファイルへの複数アクセスの問題はありません...)。予想されるボトルネックはありますか?
(問題がなければ、すべてのマシンで Linux、Ubuntu 10.04 LTS を使用しています)