これを行う方法はありますか?たとえば、処理するファイルの名前を渡しますか?
35609 次
4 に答える
41
これは別の質問で示されましたが、コマンドラインで入力パラメーターを指定して、読み込み時にそれを使用できます。たとえば、次のようになります。
コマンドライン:
pig -f script.pig -param input=somefile.txt
script.pig:
raw = LOAD '$input' AS (...);
Amazon Web Services Elastic Map Reduce を使用している場合、'$input' は、提供する入力のスクリプトに渡されるものであることに注意してください。
于 2010-11-13T01:40:41.577 に答える
-1
はい。
pig のparam
オプションを使用して、コマンドライン オプションに沿ってパラメーターを渡すことができます。
--customparam.pig
--load hdfs/local fs data
original = load '$input' using PigStorage('$delimiter');
--filter a specific field value into another bag
filtered = foreach original generate $split;
--storing data into hdfs/local fs
store filtered into '$output';
pig -x local -f customparam.pig -param input=Pig.csv -param output=OUT/pig -param delimiter="," -param split='$1'
詳細については、これを確認してください
于 2014-07-29T04:31:49.783 に答える