私は MongoDB で MapReduce の基本を理解しようとしてきましたが、それを実装した後でも、SQL の GROUP BY や Mongo 独自の GROUP BY とどのように違うのか正確にはわかりません。SQL サーバーでは、GROUP BY はストリームまたはハッシュ集計によって実行できます。MapReduce はハッシュ集計に似ていませんか?サーバーが多数あるだけです。
「重い操作」であるため、MongoDB の MR をバックグラウンド プロセスとして実行する場所を読んでいます。データがシャーディングされていることを考えると、GROUP BY も同様に「重い」のではないでしょうか? とはいえ、MR ジョブとして、または GROUP BY クエリを使用して実装できるタイプの操作のみを比較しようとしています。
GROUP BY ではできず、MR だけでできることはありますか?
また、Hadoop は MR に非常に優れているようです (これは私が読んだものにすぎません..私は Hadoop に取り組んだことがありません)。Hadoop の MR は Mongo の MR とどう違うのですか?
よくわかりません。MapReduce の必要性を説明する優れたチュートリアルを教えてください。