2 つのクラス間でいくつかの値を分類する必要があります。トレーニング セットとして使用できる約 30 の値があり、各値には 10 の異なる次元があります。私は(Pythonで)libSVMを使用していますが、うまく機能しているようです。
libSVM によって計算されたモデルにも解釈を与えようとしています。これは、分類プロセスにおいて、いくつかの次元が他の次元よりも「重要」であると考えているためです。
たとえば、次の例を考えてみましょう。
y, x = [1,1,1,-1,-1,-1],[[1,-1],[1,0],[1,1],[-1,-1],[-1,0],[-1,1]]
prob = svm_problem(y, x)
param = svm_parameter()
param.kernel_type = LINEAR
param.C = 10
m = svm_train(prob, param)
svm_save_model('model_file', m)
x リストの要素の 2 番目の次元が、このデータ セットを分類するのに役に立たないことは明らかです。
私の質問は:
libSVM によって生成されたモデルを分析して、この種の状況を検出する体系的な方法はありますか?