hdfs -put を使用して、20GB の大きなファイルを hdfs にロードしています。現在、プロセスは 4 分で実行されます。hdfsにデータをロードする際の書き込み時間を改善しようとしています。さまざまなブロックサイズを利用して書き込み速度を改善しようとしましたが、以下の結果が得られました:
512M blocksize = 4mins;
256M blocksize = 4mins;
128M blocksize = 4mins;
64M blocksize = 4mins;
ボトルネックが何であるか、および -put コマンドのパフォーマンスを向上させるために調査できる他のオプションを知っている人はいますか?