入力ファイルが zip ファイル内の csv であるストリーミング ジョブを実行しようとしています。これを使用してみましたが、CDH4 では動作しないようです (エラーが発生しますclass com.cotdp.hadoop.ZipFileInputFormat not org.apache.hadoop.mapred.InputFormat
) 。
zip ファイルのストリーミングに使用できる入力ファイル リーダーを知っている人はいますか? 可能であれば、マルチファイル リーダー (最上位ディレクトリを指定できる) を探しています。