hadoop map reduce を使用して 2 つの非常に大きなデータセットで結合を実行するための最良の方法は何ですか? 分散キャッシュまたは arraylist のような一時ストレージは、両方のデータ セットが非常に大きいため、中間データを格納できません。
hadoop map reduce を使用して 2 つの非常に大きなデータセットで結合を実行するための最良の方法は何ですか? 分散キャッシュまたは arraylist のような一時ストレージは、両方のデータ セットが非常に大きいため、中間データを格納できません。