http://www.cloudera.com/content/cloudera-content/cloudera-docs/DemoVMs/Cloudera-QuickStart-VM/cloudera_quickstart_vm.htmlからダウンロードした Cloudera QuickStart VM でエラーが発生します。
私は Tom White のHadoop: The Definitive Guide bookmap_temp.pig
からおもちゃの例を試しています。これは、「年ごとの最大温度を見つける」というものです。
temps.txt
各行に (年、温度、品質) エントリを含むファイルを作成しました。
1950 0 1
1950 22 1
1950 -11 1
1949 111 1
本のサンプル コードを使用して、次の Pig コードを Grunt ターミナルに入力しました。
records = LOAD '/home/cloudera/Desktop/temps.txt'
AS (year:chararray, temperature:int, quality:int);
DUMP records;
と入力した後DUMP records;
、次のエラーが表示されました。
2014-05-22 11:33:34,286 [メイン] エラー org.apache.pig.tools.grunt.Grunt - エラー 1066: エイリアス レコードの反復子を開けません。バックエンド エラー: org.apache.hadoop.yarn.exceptions.ApplicationNotFoundException: ID 'application_1400775973236_0006' のアプリケーションが RM に存在しません。
…</p>
ログファイルの詳細: /home/cloudera/Desktop/pig_1400782722689.log
Google 検索でエラーの原因を突き止めようとしました: https://www.google.com/search?q=%22application+with+id%22+%22doesn%27t+exist+in+RM%22
.
そこでの結果は役に立ちませんでした。たとえば、http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-troubleshoot-error-vpc.htmlはこのバグについて言及し、「この問題を解決するには、DHCP を含む VPC を設定する必要があります。パラメータが次の値に設定されているオプション セット...」
私はAWSを使用していないため、Amazonが提案する修正は問題ではないようです。
編集:
HDFS ファイル パスは正しいと思います。
[cloudera@localhost Desktop]$ ls
Eclipse.desktop gnome-terminal.desktop max_temp.pig temps.txt
[cloudera@localhost Desktop]$ pwd
/home/cloudera/Desktop