4

私は SVMlight を初めて使用します。ソース コードをダウンロードし、SVMlight をコンパイルしました。

トレーニングとテストのデータセットを作成しました。そして走った

[command]

モデルファイルを作成しています。このモデル ファイルを使用して、予測ファイルを作成する svm_classify を実行しました。予測ファイルにはいくつかの値が含まれています。

これらの数字は何を表していますか? データを -1 と +1 に分類したいのですが、予測ファイルにそのような値がありません。

モデルファイル:

SVM-light Version V6.02
0 # kernel type
3 # kernel parameter -d 
1 # kernel parameter -g 
1 # kernel parameter -s 
1 # kernel parameter -r 
empty# kernel parameter -u 
9947 # highest feature index 
2000 # number of training documents 
879 # number of support vectors plus 1 
-0.13217617 # threshold b, each following line is a SV (starting with alpha*y)
-1.0000000005381390888459236521157 6:0.013155501 9:0.10063701 27:0.038305663    41:0.12115256 63:0.056871183 142:0.020468477 206:0.12547429 286:0.073713586 406:0.12335037 578:0.40131235 720:0.13097784 960:0.30321017 1607:0.17021149 2205:0.5118736 3177:0.54580438 4507:0.27290219 #
-0.61395623101405172317157621364458 6:0.019937159 27:0.019350741 31:0.025329925 37:0.031444062 42:0.11928168 83:0.03443896 127:0.066094264 142:0.0086166598 162:0.035993244 190:0.056980081 202:0.16503957 286:0.074475288 323:0.056850906 386:0.052928429 408:0.039132856 411:0.049789339 480:0.048880257 500:0.068775021 506:0.037179198 555:0.076585822 594:0.063632675 663:0.062197074 673:0.067195281 782:0.075720288 834:0.066969693 923:0.44677126 1146:0.076086208 1191:0.5542227 1225:0.059279677 1302:0.094811738 1305:0.060443446 1379:0.070145406 1544:0.087077379 1936:0.089480147 2451:0.31556693 2796:0.1145037 2833:0.20080972 6242:0.1545693 6574:0.28386003 7639:0.29435158 #

等...

予測ファイル:

1.0142989
1.3699419
1.4742762
0.52224801
0.41167112
1.3597693
0.91790572
1.1846312
1.5038173
-1.7641716
-1.4615855
-0.75832723

等...

4

1 に答える 1

1

トレーニング ファイルで、既知のクラス (+1、-1) を提供しましたか? すなわち

-1 1:0.43 3:0.12 9284:0.2 # abcdef

このファイルと実行したコマンドの抜粋を提供できますか?

予測ファイルには、トレーニングしたモデルに従って各データ ポイントの値が保持されます。0 未満の値はデータポイントを -1 カテゴリに分類し、0 を超える値は +1 カテゴリに分類すると考えることができます。

トレーニング セットで分類を実行すると、モデルが機能する場所と失敗する場所が表示されます。

于 2015-04-07T16:55:37.017 に答える