0

私は厄介な問題に直面しています。最新バージョンの cygwin を搭載した windows7/64 ビット マシンで PIG 0.11 を実行しています。

私は、同じユーザーのすべてのユーザー アクティビティをまとめて処理の次の行にフィードするために、userName で注文したいウェブログです。

私は commandprompt を開始しています -> cygwin.bat -> cygwin コンソールで D:/ -> pig に移動し、grunt Shall (ローカル モード) で次のスクリプトを入力します。(PIG_HOME、PIG_CLASSPATHを正しく設定したことに注意してください)。

スクリプトは次のとおりです。

USERACTIVITIES = LOAD '/D:/path/of/logs/useractivities' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',') AS (datetimeUnProcessed:chararray, username:chararray, request:chararray);
 USERACTIVITIES_ORDERED = ORDER USERACTIVITIES by username;
STORE USERACTIVITIES_ORDERED INTO '/D:/readyfornextinput/useractivities' USING org.apache.pig.piggybank.storage.CSVExcelStorage(',');

USERACTIVITIES_ORDERED を説明すると、スムーズに進むことがわかります。しかし、ストア/ダンプを行うと、問題が発生します。

java.lang.RuntimeException: org.apache.hadoop.mapreduce.lib.input.InvalidInputException: 入力パスが存在しません: file:/D:/pigsample_1749383998_1377684507424 と言って失敗します。

この pigsample_number ファイルを検索しようとすると、次の場所で見つけることができました: D:/tmp//mapred/local/localRunner

それがどのように起こっているのかわかりません。Windows/cygwin 関連の問題なのか、誰かが Linux でもこれを見たのかはわかりません。

参考までに、ここにスタックトレースが添付されています。

2013-08-28 15:38:28,863 [スレッド 46] 警告 org.apache.hadoop.mapred.LocalJobRunner - job_local_0004 java.lang.RuntimeException: org.apache.hadoop.mapreduce.lib.input.InvalidInputException: 入力パスはありません存在しない: file:/D:/pigsample_1749383998_1377684507424 at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.partitioners.WeightedRangePartitioner.setConf(WeightedRangePartitioner.java:157) at org.apache.hadoop.util.ReflectionUtils.setConf( ReflectionUtils.java:62) の org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117) の org.apache.hadoop.mapred.MapTask$NewOutputCollector.(MapTask.java:677) の org.apache. org.apache.hadoop の org.apache.hadoop.mapred.MapTask.run(MapTask.java:370) の hadoop.mapred.MapTask.runNewMapper(MapTask.java:756)。mapred.LocalJobRunner$Job.run(LocalJobRunner.java:214) 原因: org.apache.hadoop.mapreduce.lib.input.InvalidInputException: 入力パスが存在しません: file:/D:/pigsample_1288777582_1377684802262 at org.apache.hadoop .mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:235) org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigFileInputFormat.listStatus(PigFileInputFormat.java:37) org.apache.hadoop.mapreduce org.apache.pig.impl.io.ReadToEndLoader.init(ReadToEndLoader.java:190) の .lib.input.FileInputFormat.getSplits(FileInputFormat.java:252) org.apache.pig.impl.io.ReadToEndLoader.( ReadToEndLoader.java:126) org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.partitioners.WeightedRangePartitioner.setConf(WeightedRangePartitioner.java:131) ... 6 つ以上

これに関するヘルプは役に立ちます。

4

1 に答える 1

0

これはcygwin環境でのみ再現可能のようです。ここに根本的な原因と解決策を文書化しました

于 2013-09-07T16:33:51.720 に答える