Hadoopは中間結果をローカルディスクに書き込み、レデューサーの結果をHDFSに書き込みます。HDFSとはどういう意味ですか。それは物理的に何に翻訳されますか
2 に答える
HDFSはHadoop分散ファイルシステムです。物理的には、クラスターの各ノードで実行されるプログラムであり、ローカルファイルシステムと非常によく似たファイルシステムインターフェイスを提供します。ただし、HDFSに書き込まれたデータは、ローカルディスクに保存されるだけでなく、クラスター全体のディスクに分散されます。通常、HDFSに保存されているデータも複製されるため、同じデータブロックがクラスター内の複数のノードに表示される場合があります。これにより、信頼性の高いアクセスが提供されるため、1つのノードがクラッシュしたりビジー状態になったりしても、誰かがHDFSから特定のデータブロックを読み取ることができなくなることはありません。
詳細については、 http://en.wikipedia.org/wiki/Hadoop_Distributed_File_System#Hadoop_Distributed_File_Systemを確認してください。
Chaseが示したように、HDFSはHadoop分散ファイルシステムです。
可能であれば、HDFSとMap / Reduceフレームワークがどのように機能するかについてのこのチュートリアルとビデオをお勧めします。これは、Hadoopの世界へのガイドとして役立ちます:http ://www.cloudera.com/resource/introduction-to-apache -mapreduce-and-hdfs /