Hadoop 分散キャッシュについての理解を明確にしたいと思います。分散キャッシュにファイルを追加すると、ファイルがクラスター内のすべてのノードのディスクにロードされることはわかっています。
では、ファイルのデータはどのようにしてクラスター内のすべてのノードに送信されるのでしょうか。ネットワーク経由ですか?その場合、ネットワークに負担がかかりませんか?
以下のような考えを持っていますが、正しいですか?
ファイルが大きい場合、ネットワークが混雑しませんか?
ノード数が多い場合、ファイルのサイズが中規模または小規模であっても、ファイルのレプリケーションとすべてのノードへの送信により、ネットワークの輻輳やメモリの制約が発生することはありませんか?
これらの概念を理解するのを手伝ってください。
ありがとう!!!