私は現在、MR-MPI (MapReduce on MPI) での機械学習アルゴリズムの実装に取り組んでいます。また、他の MapReduce フレームワーク、特に Hadoop について理解しようとしているので、以下が私の基本的な質問です (私は MapReduce フレームワークを初めて使用します。私の質問が意味をなさない場合はお詫びします)。
質問: MapReduce は、並列ファイル システム (GPFS)、HDFS、MPI などの多くのものの上に実装できるためです。map ステップの後に、照合操作があり、その後に縮小操作が続きます。照合操作では、ノード間で何らかのデータ移動が発生する必要があります。この点で、HDFS と GPFS と MPI のデータ移動メカニズム (ノード間) の違いを知りたいです。
適切な説明を提供していただければ幸いです。また、これらのそれぞれについて適切な参考資料を提供していただければ、さらに詳しく説明できます。
ありがとう。