1

Load data flowステップを使用している豚では、(PigStorageを使用して)使用する場合と使用しない場合の違いは何ですか?

以下の手順の違いを知りたい。

movie2 = load 'movie/part-m-00000' as (mid:int, mname:chararray, myr:int);

movie2 = load 'movie/part-m-00000' using PigStorage(',') as (mid:int, mname:chararray, myr:int);
4

2 に答える 2

0

rspの回答に追加すると、PigStorageを使用する利点が2つあります

  1. ファイル区切り文字を指定するオプション

  2. 入力のスキーマをロードするかどうかのオプション。

詳細はこちら: http://pig.apache.org/docs/r0.10.0/api/org/apache/pig/builtin/PigStorage.html

于 2012-12-07T00:33:19.607 に答える
0

デフォルトでは、PigStorage が使用されます。これは、フィールドが区切り文字で区切られたテキスト ファイルであり、タブ文字が区切り文字として使用されます。

指定using PigStorage(',')すると区切り文字がカンマに変わります。

于 2012-11-24T17:31:43.153 に答える