r - サポートベクターマシントレインキャレットエラー kernlab クラスの確率計算に失敗しました。NAを返す

Question

私はいくつかのデータを持っており、Y変数は要因です-良いか悪いか。「caret」パッケージの「train」メソッドを使用して、サポートベクターマシンを構築しています。「トレーニング」機能を使用して、さまざまな調整パラメーターの値を確定し、最終的なサポートベクターマシンを取得することができました。テストデータについては、「クラス」を予測できます。しかし、テストデータの確率を予測しようとすると、エラーを下回ります (たとえば、私のモデルでは、テストデータの 1 番目のデータポイントが y='good' であることがわかりますが、'good' になる確率を知りたいです)。 ...一般に、サポートベクターマシンの場合、モデルは予測の確率を計算します..Y 変数に 2 つの結果がある場合、モデルは各結果の確率を予測します.最大の確率を持つ結果が最終的な解と見なされます)

**Warning message:  
In probFunction(method, modelFit, ppUnk) :  
  kernlab class probability calculations failed; returning NAs**

以下のサンプルコード

library(caret)
trainset <- data.frame( 
     class=factor(c("Good",    "Bad",   "Good", "Good", "Bad",  "Good", "Good", "Good", "Good", "Bad",  "Bad",  "Bad")),
     age=c(67,  22, 49, 45, 53, 35, 53, 35, 61, 28, 25, 24))

testset <- data.frame( 
     class=factor(c("Good",    "Bad",   "Good"  )),
    age=c(64,   23, 50))



library(kernlab)
set.seed(231)

### finding optimal value of a tuning parameter
sigDist <- sigest(class ~ ., data = trainset, frac = 1)
### creating a grid of two tuning parameters, .sigma comes from the earlier line. we are trying to find best value of .C
svmTuneGrid <- data.frame(.sigma = sigDist[1], .C = 2^(-2:7))

set.seed(1056)
svmFit <- train(class ~ .,
                data = trainset,
                method = "svmRadial",
                preProc = c("center", "scale"),
                tuneGrid = svmTuneGrid,
                trControl = trainControl(method = "repeatedcv", repeats = 5))

### svmFit finds the optimal values of tuning parameters and builds the model using the best parameters

### to predict class of test data
predictedClasses <- predict(svmFit, testset )
str(predictedClasses)


### predict probablities but i get an error
predictedProbs <- predict(svmFit, newdata = testset , type = "prob")
head(predictedProbs)

この行の下の新しい質問: 以下の出力によると、9 つのサポートベクターがあります。12 個のトレーニングデータポイントのうち 9 個を認識する方法は?

svmFit$finalModel

クラス「ksvm」のサポートベクターマシンオブジェクト

SV タイプ: C-svc (分類) パラメータ: コスト C = 1

Gaussian Radial Basis カーネル関数。ハイパーパラメータ: シグマ = 0.72640759446315

サポートベクターの数 : 9

目的関数値: -5.6994 トレーニングエラー: 0.083333

score 14 · Accepted Answer

classProbs = TRUEトレーニング制御ステートメントでは、クラスの確率を返すかどうかを指定する必要があります。

svmFit <- train(class ~ .,
    data = trainset,
    method = "svmRadial",
    preProc = c("center", "scale"),
    tuneGrid = svmTuneGrid,
    trControl = trainControl(method = "repeatedcv", repeats = 5, 
classProbs =  TRUE))

predictedClasses <- predict(svmFit, testset )
predictedProbs <- predict(svmFit, newdata = testset , type = "prob")

テストデータセットの Bad または Good クラスに含まれる確率を次のように指定します。

print(predictedProbs)
    Bad      Good
1 0.2302979 0.7697021
2 0.7135050 0.2864950
3 0.2230889 0.7769111

編集

新しい質問に答えるために、元のデータセット内のサポートベクターの位置にalphaindex(svmFit$finalModel)with係数でアクセスできますcoef(svmFit$finalModel)。

r - サポート ベクター マシン トレイン キャレット エラー kernlab クラスの確率計算に失敗しました。NAを返す

1 に答える 1

編集

Related

Reference

r - サポートベクターマシントレインキャレットエラー kernlab クラスの確率計算に失敗しました。NAを返す