もう1つ、非常に基本的な概念レベルの質問が思い浮かびます。HDFSとさまざまなファイル形式(シーケンスファイル(それに基づくマップファイル)、HARファイル)の違いと関係は何ですか?
答えは、HDFSが基盤ファイルシステムであり、生のバイナリファイルをHDFSにアップロードでき(シーケンスファイルやHARファイルなどを使用せずに)、特別に設計されたファイル形式を使用してに基づいてファイルを書き込むこともできると思います。 HDFS-シーケンスファイル(それに基づくマップファイル)形式、HARファイル形式のように。それは正しい理解ですか?