1

私は PIG の概念に不慣れです。これで、ファイルが HDFS にマウントされました。を使用してファイルをロードしている間

A = LOAD 'user/vishal/output/part-00000' USING PigStorage(' ') as (name,occourence)

それは適切に起こっていますが、私がFILTERコマンドを使用している間

FLT = 出現回数 > '20' および出現回数 < '35' による FILTER A;

次のエラーが発生しています

2013-02-27 11:06:16,264 [メイン] 警告 org.apache.pig.PigServer - 警告 IMPLICIT_CAST_TO_CHARARRAY 6 回が発生しました

何が問題になる可能性がありますか

ありがとう

4

1 に答える 1

1

pig の列のデフォルトのデータ型は bytearray です。

発生は以下のような int データ型である必要があります。

A = LOAD 'user/vishal/output/part-00000' USING PigStorage(' ') as (name:chararray,occourence:int);

これで、以下のようにフィルタリングできます (引用符なし)。

FLT = FILTER A by occourence > 20 and occourence < 35;
于 2013-02-27T06:57:02.850 に答える