テキスト ファイルがあり、その最初の行にヘッダーが含まれています。今、データに対して何らかの操作を行いたいのですが、PigStorage を使用してファイルをロードしている間、HEADER も必要です。HEADERをスキップしたいだけです。(直接または UDF を介して) そうすることは可能ですか?
これは、データをロードするために使用しているコマンドです。
input_file = load '/home/hadoop/smdb_tracedata.csv'
USING PigStorage(',')
as (trans:chararray, carrier:chararray,aainday:chararray);