単一のシステム (疑似分散モード) で、Mahout の分類用のデシジョン フォレストを構築する Breiman の例を実行しようとしています。このチュートリアルを参照し ています。チュートリアルの最初の 2 つのステップには問題はありませんが、3 番目のステップ (「データセットのファイル記述子を生成する」) では、以下に示すように例外がスローされます。
Exception in thread "main" java.lang.ClassNotFoundException: org.apache.mahout.classifier.df.tools.Describe
at java.net.URLClassLoader$1.run(URLClassLoader.java:366)
at java.net.URLClassLoader$1.run(URLClassLoader.java:355)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:354)
at java.lang.ClassLoader.loadClass(ClassLoader.java:423)
at java.lang.ClassLoader.loadClass(ClassLoader.java:356)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:266)
at org.apache.hadoop.util.RunJar.main(RunJar.java:149)
私が実行したコマンドは
hadoop_admin@ubuntu:~/hadoop$ bin/hadoop jar /home/viggi/workspace/mahout-distribution-0.5/mahout-core-0.5-job.jar org.apache.mahout.classifier.df.tools.Describe -p data10/glass.data -f data10/glass.info -d I 9 N L
同様の例外を伴うスタック オーバーフローの投稿を見つけました。java.lang.NoClassDefFoundError mahout や Breiman の例とは関係ありませんが、ダウンロードして .xml にHttpClient jar-library
入れるという推奨される解決策を採用することにしました$MAHOUT_HOME/lib
。うまくいきませんでした。したがって、誰かがその 3 番目のステップが実際に何をするのか、およびそれらの例外を取り除く方法を説明できれば、それは本当に役に立ちます。