10

GUIからWekaのCSVLoaderを使用してCSVをARFFに変換しようとしています。"オプションでは、ファイルに引用符はありませんが、文字列の囲み文字をに設定しました。次のエラーが発生します。

weka.core.converters.CSVLoaderfailed to lead <my file>
Reason:
wrong number of values. Read 2, expected 23, read Token[EOL], line 1763

1762-1764行目は次のとおりです。

450c787001b004af69428e267c7a4ca1,I_need need_to to_go go_back back_to to_my my_live live_food food_diet diet_PPP PPP_Not Not_90% 90%_like like_before before_CCC CCC_but but_I I_bet bet_I I_could could_do do_75% 75%_without without_losing losing_too too_much much_weight weight_PPP PPP_PPP,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-12.5611111111,0.248945147679,0.0595238095238
450c787001b004af69428e267c7a4ca1,It's_ugly ugly_here here_PPP PPP_But But_there there_are are_sparks sparks_PPP PPP_PPP PPP_PPPmoments PPPmoments_PPP PPP_Love Love_PPP,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-15.91,0.299242424242,0.1
450c787001b004af69428e267c7a4ca1,I_guess guess_it it_all all_depends depends_on on_your your_mood mood_PPP PPP_PPP PPP_PPPwhy PPPwhy_can't can't_these these_meds meds_be be_any any_damn damn_good good_QQQ,2.30,3.50,4.50,2.85,4.50,n,y,y,n,y,AM,297,41728.8,95.58,0.03,42826,0.49,0.17,-12.9970588235,0.0,0.0344827586207

何か案は?エラーが見つからないようです。

EDIT---

もちろん、投稿した直後に「エラー」が見つかりました。CSVLoaderは%文字を好みません。だから、私は私の質問を変更しました:これがなぜであるか、または他のどのキャラクターがそれによって好まれないのか誰かが知っていますか?

4

3 に答える 3

15

これらの文字をデータとして使用すると、通常は問題が発生します

, = " ' *+ -%

于 2014-03-14T20:51:25.407 に答える
4

このコードをR言語で使用してファイルを変更すると、問題が100%解決します

mydata=read.csv("train.csv",header=TRUE)
library("foreign")
write.arff(x =mydata ,file= "train.arff")
于 2016-06-17T13:48:38.093 に答える
3

エラーは、1763 行のアポストロフィが原因です。

于 2015-07-28T20:32:49.490 に答える