2

Thorsten Joachims による SVM-light を使用して、SVM のトピックを調べています。

現在、いくつかの紹介論文によると:

「R nの有向超平面の集合の VC 次元は n+1 [...]」

「C = inf の場合、最適な超平面は、データを完全に分離するものになります (存在する場合) [...]」

私は 2 次元の線形分離可能なデータセットを準備しており、非常に多くの図からわかっている 2 次元のハード マージン分類器を見たいと思っていました。

そこで、次のパラメータを選択しました。

  • 多項式カーネル (a*b+c) d (d = 2 )
  • C = 999 (infに近づくように)

3 つのサポート ベクターを取得しましたが、これは問題ありませんが、推定 VC 次元は 10,000 を超えています。

カーネルが 2 次元のみの場合、これほど高い VCdim を持つことができるのでしょうか?

4

2 に答える 2

1

VC ディメンションは、特定のソリューションの SV の量には対応しません。

VC ディメンションは、それらのポイントに関連付けられたラベルの任意の組み合わせについて、モデルによって完全に粉砕できるデータセット サンプルの最大数です。一方、サポート ベクターは超平面を定義する点です。

編集:

あなたのコメントに基づいて、私の答えを少し拡張しています。

まず、あなたがこれを言うとき:

「C = inf の場合、最適な超平面は、データを完全に分離するものになります (存在する場合) [...]」

これは、C と VC ディメンションの間に直接的な関係があることを意味するものではありません (C=999 は 10000 の VC ディメンションを生成すると言ったときに示唆したように)。つまり、 C = inf を使用すると、すべての制約が適用され、ハード マージン モデル (データを完全に分離する超平面) が生成されます。

「R^n の有向超平面のセットの VC 次元が n+1 であるという事実は、2 次元にマッピングされる多項式カーネルを適用するときにも保持されるかどうか」

これは特徴空間では当てはまりますが、入力空間の決定境界はもはや超平面ではなく、実際には非線形になることに注意してください。

"多項式カーネル (a*b+c)^d with d = 2" ... "カーネルが 2 次元だけの場合は?"

そのカーネルは二次元ではなく、他のパラメーターに応じて異なる方法でマッピングされます。

于 2014-01-03T15:10:22.323 に答える