HDFS には多くのファイルがあり、そのすべてが 1 つの CSV ファイルを含む zip ファイルです。ストリーミング ジョブを実行できるように、ファイルを解凍しようとしています。
私は試した:
hadoop jar /usr/lib/hadoop-mapreduce/hadoop-streaming.jar \
-D mapred.reduce.tasks=0 \
-mapper /bin/zcat -reducer /bin/cat \
-input /path/to/files/ \
-output /path/to/output
ただし、エラーが発生します ( subprocess failed with code 1
) 単一のファイルで実行しようとしましたが、同じエラーです。
何かアドバイス?