0

CSVファイルでmahoutSGD分類子を実行しようとしていますが、このエラーが発生します-

 
[vineet@localhost bin]$ ./mahout trainlogistic --input ./filtered.csv --output model --target target --categories 33 \
--features 200 --passes 10 --predictors subject --types text --rate 50

hadoop binary is not in PATH,HADOOP_HOME/bin,HADOOP_PREFIX/bin, running locally Exception in thread "main" java.lang.IndexOutOfBoundsException: Index: 6, Size: 4 at java.util.ArrayList.rangeCheck(ArrayList.java:604) at java.util.ArrayList.get(ArrayList.java:382) at org.apache.mahout.classifier.sgd.CsvRecordFactory.processLine(CsvRecordFactory.java:245) at org.apache.mahout.classifier.sgd.TrainLogistic.mainToOutput(TrainLogistic.java:85) at org.apache.mahout.classifier.sgd.TrainLogistic.main(TrainLogistic.java:65) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:601) at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:68) at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:139) at org.apache.mahout.driver.MahoutDriver.main(MahoutDriver.java:195)

CSVファイルには、Unicodeテキストと、引用符で囲まれた大きなテキストフィールドが含まれています。

サンプルのdonut.csvで分類子を試しましたが、正常に機能します。また、ヘッダー行を「id」、「subject」、「field2」などのように変更しようとしましたが、それでも機能しません。

私は何が間違っているのですか?

4

1 に答える 1

1

一部の行がダーティになる可能性があります。6ではなく4つの属性しかありません。データをもう一度確認するか、1行のデータのみをフィードして推測を検証してください。

于 2013-03-21T01:27:10.330 に答える