1

http://www.cloudera.com/content/cloudera-content/cloudera-docs/DemoVMs/Cloudera-QuickStart-VM/cloudera_quickstart_vm.htmlからダウンロードした Cloudera QuickStart VM でエラーが発生します。

私は Tom White のHadoop: The Definitive Guide bookmap_temp.pigからおもちゃの例を試しています。これは、「年ごとの最大温度を見つける」というものです。

temps.txt各行に (年、温度、品質) エントリを含むファイルを作成しました。

1950 0 1

1950 22 1

1950 -11 1

1949 111 1

本のサンプル コードを使用して、次の Pig コードを Grunt ターミナルに入力しました。

records = LOAD '/home/cloudera/Desktop/temps.txt'

  AS (year:chararray, temperature:int, quality:int);

DUMP records;

と入力した後DUMP records;、次のエラーが表示されました。

2014-05-22 11:33:34,286 [メイン] エラー org.apache.pig.tools.grunt.Grunt - エラー 1066: エイリアス レコードの反復子を開けません。バックエンド エラー: org.apache.hadoop.yarn.exceptions.ApplicationNotFoundException: ID 'application_1400775973236_0006' のアプリケーションが RM に存在しません。

…</p>

ログファイルの詳細: /home/cloudera/Desktop/pig_1400782722689.log

Google 検索でエラーの原因を突き止めようとしました: https://www.google.com/search?q=%22application+with+id%22+%22doesn%27t+exist+in+RM%22.

そこでの結果は役に立ちませんでした。たとえば、http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-troubleshoot-error-vpc.htmlはこのバグについて言及し、「この問題を解決するには、DHCP を含む VPC を設定する必要があります。パラメータが次の値に設定されているオプション セット...」

私はAWSを使用していないため、Amazonが提案する修正は問題ではないようです。

編集:

HDFS ファイル パスは正しいと思います。

[cloudera@localhost Desktop]$ ls
Eclipse.desktop  gnome-terminal.desktop  max_temp.pig  temps.txt
[cloudera@localhost Desktop]$ pwd
/home/cloudera/Desktop
4

2 に答える 2

2

エラーの前に別の例外があります:

org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: hdfs://localhost.localdomain:8020/home/cloudera/Desktop/temps.txt
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigInputFormat.getSplits(PigInputFormat.java:288)

ファイルは HDFS にありますか? ファイルパスは確認しましたか?

于 2014-05-23T10:10:54.083 に答える