Hadoop 0.20.2 を使用していますが、可能であれば -cat シェル コマンドを使用して 2 つのファイルを 1 つに連結したいと考えています (ソース: http://hadoop.apache.org/common/docs/r0.19.2/hdfs_shell.html ) 。
これが私が提出しているコマンドです(名前は変更されています):
**/path/path/path/hadoop-0.20.2> bin/hadoop fs -cat /user/username/folder/csv1.csv /user/username/folder/csv2.csv > /user/username/folder/outputdirectory/**
bash が返されます: /user/username/folder/outputdirectory/: No such file or directory
また、そのディレクトリを作成してから再度実行しようとしましたが、「そのようなファイルまたはディレクトリはありません」というエラーが引き続き表示されます。
また、-cpコマンドを使用して両方を新しいフォルダーにコピーし、-getmergeを使用してそれらを結合しようとしましたが、getmergeでもうまくいきません。
これを Hadoop で行う理由は、ファイルが巨大であり、Hadoop の外部でダウンロード、マージ、および再アップロードするのに長い時間がかかるためです。