7

Terasortベンチマークを実行しようとしていますが、次の例外が発生します。

java.lang.RuntimeException: Error in configuring object
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117)
    at org.apache.hadoop.mapred.MapTask$OldOutputCollector.<init>(MapTask.java:573)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:435)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:371)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:259)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
    at org.apache.hadoop.mapred.Child.main(Child.java:253)
Caused by: java.lang.reflect.InvocationTargetException
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:88)
    ... 10 more
Caused by: java.lang.IllegalArgumentException: can't read paritions file
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:213)
    ... 15 more
Caused by: java.io.FileNotFoundException: File _partition.lst does not exist.
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:371)
    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:245)
    at org.apache.hadoop.fs.FileSystem.getLength(FileSystem.java:720)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1417)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1412)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.readPartitions(TeraSort.java:153)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:210)
    ... 15 more

TeraGenコマンドは正常に実行され、TeraSortの入力ファイルを作成しました。これが私の入力ディレクトリのリストです:

bin/hadoop fs -ls /user/hadoop/terasort-input/Warning: Maximum heap size rounded up to 1024 MB
Found 5 items
-rw-r--r--   1 sqatest supergroup           0 2012-01-23 14:13 /user/hadoop/terasort-input/_SUCCESS
drwxr-xr-x   - sqatest supergroup           0 2012-01-23 13:30 /user/hadoop/terasort-input/_logs
-rw-r--r--   1 sqatest supergroup         129 2012-01-23 15:49 /user/hadoop/terasort-input/_partition.lst
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00000
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00001

これがterasortを実行するための私のコマンドです:

bin/hadoop jar hadoop-examples-0.20.203.0.jar terasort -libjars hadoop-examples-0.20.203.0.jar /user/hadoop/terasort-input /user/hadoop/terasort-output

入力ディレクトリにファイル_partition.lstが表示されますが、FileNotFoundExceptionが発生する理由がわかりません。

http://www.michael-noll.com/blog/2011/04/09/benchmarking-and-stress-testing-an-hadoop-cluster-with-terasort-testdfsio-nnbench-で提供されているセットアップの詳細に従いました。 mrbench /

4

4 に答える 4

0

私はこれを次のように機能させました:

私はhadoopベースディレクトリ、hadoop-1.0.0からローカルモードで実行しており、その下に入力サブディレクトリがありますが、同じエラーが発生します。

失敗したJavaファイルを編集して、ファイル名ではなくパスをログに記録し、再構築( "ant binary")して、再実行しました。それは私が実行していたディレクトリでファイルを探していました。それがhadoopベースディレクトリと実行ディレクトリのどちらを検索していたのかわかりません。

...したがって、入力ディレクトリ内の実際のファイルを指すようにterasortを実行するディレクトリにシンボリックリンクを作成しました。

安価なハックですが、機能します。

- Tim.
于 2012-02-08T07:21:13.110 に答える
0

NFSにジョブを展開していたため、問題が発生していました。hadoop.tmp.dirをローカルファイルシステム(/ tmp)を指すように変更したところ、問題はすぐに解消されました。

于 2012-02-16T06:03:54.933 に答える
0

疑似分散モード(または実際のクラスター)で実行するようにセットアップしましたか?Hadoopを構成しない限り、ローカルジョブランナーモードで実行されます(単一プロセス内のライブラリとして)-TerasortはLocalJobRunnerモードでは機能しません。確認する出力でLocalJobRunnerという単語を探します。

HDFS、SSH、rsyncをセットアップするためのリンクは次のとおりです。http: //hadoop.apache.org/docs/r1.1.1/single_node_setup.html#PseudoDistributed

于 2013-02-12T02:58:59.780 に答える
0

clouderaCDH4を使用しています。他のHadoopプログラムでも同様の問題に直面しました。問題は外部ライブラリのリンクに関するものだと信じています。

プログラムはEclipse(ローカルモード)で正常に動作していましたが、疑似分散モードで実行しようとすると、このエラーメッセージが表示されました。

一時的な解決策:-ライブラリ処理オプションを使用してEclipseからjarファイルを作成しました-生成されたJARの横にあるサブフォルダーに必要なライブラリをコピーします。-JARファイルをhadoopホームディレクトリ(hadoop-exampls.jarファイルが配置されるパス)にコピーしました

この修正により、エラーなしでHadoopプログラムを実行できるようになります。これがお役に立てば幸いです

于 2014-05-21T04:12:46.143 に答える