1

SVMとROCについて学んでいます。私が知っているように、人々は通常、ROC (受信者動作特性) 曲線を使用して、SVM (サポート ベクター マシン) の分類能力を示すことができます。機能の 2 つのサブセットを比較するために同じ概念を使用できるかどうか疑問に思っています。

サブセット A とサブセット B という 2 つの特徴サブセットがあるとします。それらは、2 つの異なる特徴抽出方法 A と B によって同じトレーニング データから選択されます。LIBSVM を使用して、これら 2 つの特徴サブセットを使用して同じ SVM をトレーニングするとします。 svmtrain() 関数を使用して、両方の ROC 曲線をプロットします。分類能力を AUC 値で比較できますか? したがって、subsetB よりも subsetA の AUC 値が高い場合、メソッド A がメソッド B よりも優れていると結論付けることができますか? 意味がありますか?

どうもありがとうございました、

4

1 に答える 1

2

はい、あなたは正しい方向に進んでいます。ただし、いくつかの点に注意する必要があります。

  1. 多くの場合、適切なスケーリング/正規化で2つの機能AとBを使用すると、機能を個別に使用するよりもパフォーマンスが向上します。したがって、機能Aと機能Bの両方を一緒に使用する可能性も検討する必要があります。
  2. 機能AとBを使用してSVMをトレーニングする場合は、個別に最適化する必要があります。つまり、機能Aを使用して得られた最高のパフォーマンスを機能Bを使用して得られた最高のパフォーマンスと比較します。多くの場合、機能AとBは、異なるカーネルとパラメーター設定で最高のパフォーマンスを発揮します。 。
  3. AUC以外にも、F1スコア平均精度(MAP)などのメトリックがあります。これらのメトリックは、テストデータを評価した後で計算でき、使用するアプリケーションによっては、より適切な場合があります。
于 2012-10-23T04:26:10.180 に答える