hadoop - Hadoop で HDFS のサイズを縮小する方法

Question

Hadoop を使用して十分な (約 100 万) のテキストファイルを解析していますが、それぞれに大量のデータが含まれています。まず、Eclipse を使用してすべてのテキストファイルを hdfs にアップロードしました。しかし、ファイルをアップロードするとき、map-reduce 操作により、次のディレクトリ C:\tmp\hadoop-admin\dfs\data に大量のファイルが作成されました。それで、HDFS（基本的には上記のドライブ）のサイズを縮小できるメカニズムはありますか。

score 0 · Accepted Answer

hdfs-site.xmlHDFS サイズを縮小するには、次のプロパティにより大きな値 (バイト単位) を設定できます

 dfs.datanode.du.reserved=0

マップ出力の圧縮を有効にすることで、マップ出力によって生成されるデータの量を減らすこともできます。

map.output.compress=true

それが役立つことを願っています。

hadoop - Hadoop で HDFS のサイズを縮小する方法

1 に答える 1

Related

Reference