Hadoop DFS にコピーしたいサーバーに何百もの大きな lzo 圧縮ファイルがあります。圧縮されていないファイルに対して私が通常使用するコマンドは次のとおりです。
cat someFile | ssh uname@hadoop "hadoop dfs -put - /data/someFile"
これは圧縮ファイルでは機能しないと思います(cat
おそらく意味がないため)。最初にファイルを Name Node と put にコピーする必要がありますか?
scp someFile.lzo uname@hadoop:~/ #on remote server
hadoop dfs -put someFile.lzo /data/ #on Hadoop server
rm ~/someFile.lzo
これを行うためのより良い方法があるはずです。