2

libsvm ライブラリで SVM-RFE を使用して、遺伝子発現データセットを実行しようとしています。私のアルゴリズムは Matlab で書かれています。特徴選択を適用せずに、5 倍の CV で 80++% の分類精度を生成できる特定のデータセット。このデータセットに svm-rfe を適用しようとすると (同じ svm パラメーター設定で 5 倍の CV を使用)、分類結果が悪化し、60++% の分類精度しか達成できません。

これが私のmatlabコーディングです。誰かが私のコードの問題点に光を当てることができれば幸いです。前もって感謝します。

[label, data] = libsvmread('libsvm_data.scale');
[N D] = size(data);

numfold=5; 
indices = crossvalind ('Kfold',label, numfold);
cp = classperf(label);

for i= 1:numfold

disp(strcat('Fold-',int2str(i)));
testix = (indices == i); trainix = ~testix;
test_data = data(testix,:);  test_label = label(testix);
train_data = data(trainix,:); train_label = label(trainix);

model = svmtrain(train_label, train_data, sprintf('-s 0 -t 0);    %'

s = 1:D;
r = [];
iter = 1;

    while ~isempty(s)

    X = train_data(:,s);

    fs_model = svmtrain(train_label, X, sprintf('-s 0 -t %f -c %f -g %f -b 1', kernel, cost, gamma));

    w = fs_model.SVs' * fs_model.sv_coef;    %'
    c = w.^2;
    [c_minvalue, f] = min(c);
    r = [s(f),r];
   ind = [1:f-1, f+1:length(s)];
    s = s(ind);

    iter = iter + 1;
    end

    predefined = 100;
   important_feat = r(:,D-predefined+1:end);

    for l=1:length(important_feat)
        testdata(:,l) = test_data (:,important_feat(l));
    end


 [predict_label_itest, accuracy_itest, prob_values] = svmpredict(test_label, testdata, model,'-b 1'); 
acc_itest_fs (:,i) = accuracy_itest(1);

  clear testdata;
end

Mean_itest_fs = mean((acc_itest_fs),2);
Mean_bac_fs = mean (bac_fs,2);  
4

1 に答える 1

0

RFE を traindata に適用すると、traindata のサブセットが得られます。したがって、traindata を使用してモデルをトレーニングする場合は、traindata のサブセットを使用してこのモデルをトレーニングする必要があると思います。

于 2016-05-18T11:12:38.783 に答える