0

まず第一に、私は Pig をほとんど使用したことがなく、私の組織がサポートしているため、Pig を使用しています。現在、次の方法でディレクトリからjsonファイルを読み取っています(Jacksonパーサーはこれよりも多くのことを実行できるため、制限があるため、elephntBirdを故意に使用していません)。

json = LOAD  '/user/json_data' USING TextLoader AS (line: chararray);

dump jsonと言うと、 /user/json_data ディレクトリの下にある利用可能なすべての json ファイルの内容が表示されます。現在、UDF を使用してこれらの json ファイルを解析し、データを Cassandra に挿入しています。豚の声明は次のとおりです。

result = FOREACH json GENERATE com.myorg.pig.UDF(line);

しかし、結果をダンプすると、以下の例外が表示されます:

 Pig Stack Trace
---------------
ERROR 2997: Unable to recreate exception from backed error: Error:    com.google.common.util.concurrent.Futures.withFallback(Lcom/google/common/util/concurrent/ListenableFuture;Lcom/google/common/util/concurrent/FutureFallback;Ljava/util/concurrent/Executor;)Lcom/google/common/util/concurrent/ListenableFuture;

org.apache.pig.impl.logicalLayer.FrontendException: ERROR 1066: Unable to open iterator for alias result. Backend error : Unable to recreate exception from backed error: Error: com.google.common.util.concurrent.Futures.withFallback(Lcom/google/common/util/concurrent/ListenableFuture;Lcom/google/common/util/concurrent/FutureFallback;Ljava/util/concurrent/Executor;)Lcom/google/common/util/concurrent/ListenableFuture;
at org.apache.pig.PigServer.openIterator(PigServer.java:828)
at org.apache.pig.tools.grunt.GruntParser.processDump(GruntParser.java:696)
at org.apache.pig.tools.pigscript.parser.PigScriptParser.parse(PigScriptParser.java:320)
at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:194)
at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:170)
at org.apache.pig.tools.grunt.Grunt.run(Grunt.java:69)
at org.apache.pig.Main.run(Main.java:538)
at org.apache.pig.Main.main(Main.java:157)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:208)
Caused by: org.apache.pig.backend.executionengine.ExecException: ERROR 2997: Unable to recreate exception from backed error: Error: com.google.common.util.concurrent.Futures.withFallback(Lcom/google/common/util/concurrent/ListenableFuture;Lcom/google/common/util/concurrent/FutureFallback;Ljava/util/concurrent/Executor;)Lcom/google/common/util/concurrent/ListenableFuture;
at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.Launcher.getErrorMessages(Launcher.java:217)
at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.Launcher.getStats(Launcher.java:149)
at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher.launchPig(MapReduceLauncher.java:400)
at org.apache.pig.PigServer.launchPlan(PigServer.java:1266)
at org.apache.pig.PigServer.executeCompiledLogicalPlan(PigServer.java:1251)
at org.apache.pig.PigServer.storeEx(PigServer.java:933)
at org.apache.pig.PigServer.store(PigServer.java:900)
at org.apache.pig.PigServer.openIterator(PigServer.java:813)
... 12 more

私のUDFは:

public class UDF extends EvalFunc<String> {


@Override
public String exec(Tuple tuple) throws IOException {
    if (null == tuple || tuple.size() != 1)
        return "bad input";
    try {
    String file = (String) tuple.get(0);
    DynamicJsonFlattener obl=new DynamicJsonFlattener(null);
    obl.processJsonToCassandra(file);

       return "processed successfully";
    } catch (Exception e) {
        return "error";
    }
  }
}

ここでいくつかの回答を見ましたが、改善は見られませんでした。間違った方法で行っている場合は、入力を提供し、代替案を提案してください。

4

1 に答える 1

0

ほとんどの場合、UDF が失敗したため、結果の関係がありません。使用しているコードは動作/テスト済みですか?

于 2016-04-08T23:01:54.730 に答える