ファイルをPigにロードするためにUDFを作成しました。テキストファイルの読み込みには適していますが、ファイルを読み取ることもできるようにする必要があり.gz
ます。.gz
ファイルを解凍してから処理できることはわかっていますが、解凍せずにファイルを読み取るだけです。
UDFをから拡張しLoadFunc
、次にコスト入力ファイルに追加しますMyInputFile extends TextInputFormat
。私も実装しMyRecordReader
ました。TextInputFormat
拡張が問題かどうか疑問に思っていますか?試しFileInputFormat
ましたが、まだファイルを読み取ることができません。.gz
以前にファイルからUDF読み取りデータを書き込んだ人はいますか?