1

分類の問題があるため、R での予測に SVM を使用しています。データセットには、整数変数とカテゴリ変数があります。predict メソッドで予測中にエラーが発生しました。

    svp3c <- ksvm(input_dataset3$isCRgt3~., data=input_dataset3,type="C-svc")
    p3<-predict(svp3c,newdata=input_dataset_prediction[,-1],type="response")

    error :: Error in which.max(votematrix[, x]) : subscript out of bounds

今回のモデリングについて

最初 : トレーニング データセットを使用して開発されたモデル

2 番目: テスト データセットでの予測用にモデルを保存して読み込む

Training Dataset sample

Headning :
head1(int),head2(character-url),head3(character-url),head4(character-url),head5(character),head6(character),haed7(int),head8(int),head9(int),head10(int),head11(int)

Data:    
"0","10","/","/index.php?main_page=logoff","(not set)","rc317a","organic","0","4","20092","5023","0"
"1","11","/","/offwhite-churidar-kameez-set-p-17381.html","(not set)","rc317a","organic","0","4","20092","5023","0"

[サンプルデータセットのダウンロード] http://www.2shared.com/file/tQRapbBt/input_dataset3.html

【Rスクリプトを再現】http://www.2shared.com/file/NpDs5V-9/data1_train.html

誰でも提案できますか?

4

1 に答える 1

0

別のデータセットで同じ問題が発生しました。最初に、predict がテスト ケースよりも少ない予測を返すことに気付きました。テストデータフレームの整数変数の 1 つに NA が含まれていることが判明しました。NA を -1 に変更すると、エラーが解消されました。
TBC - 変数を -1 に設定した場合の影響については考えていませんが、エラーが解消され、正しい数の予測が得られるようになりました。

于 2013-12-01T22:38:56.523 に答える