14

だから、私はSVMアルゴリズムがどのように機能するかを理解しようとしていますが、超平面を介してポイントを分離し、それらを分類するために数学的な意味を持つn次元平面のポイントでいくつかのデータセットを変換する方法を理解できません。

ここに例があります。彼らはトラやゾウの写真を分類しようとしています。「100x100ピクセルの画像にデジタル化するので、n次元平面にxがあり、n = 10,000です」と言われますが、私の質問はどうすればよいかということです。 2つのカテゴリに分類するために、数学的な意味を持つポイントの一部のカラーコードを実際に表す行列を変換しますか?

おそらく誰かが2Dの例でこれを説明してくれるでしょう。なぜなら、私が見るグラフィック表現はnDではなく2Dにすぎないからです。svm

4

1 に答える 1

16

簡単に言うと、行列を変換しませんが、行列内の各要素を次元として扱います(機械学習では、各要素は機能と呼ばれます)。したがって、それぞれ100x100=10000の特徴を持つ要素を分類する必要があります。線形SVMの場合、超平面を使用してこれを行います。超平面は、10,000次元の空間を2つの異なる領域に分割します。

より長い答えは次のようになります。2Dの場合を考えてみましょう。ここで、2次元要素のセットを分離する必要があります。これは、セット内の各要素が数学的に2タプル、つまりe =(x1、x2)として記述できることを意味します。たとえば、図では、いくつかの完全なドットは{(1,3)、(2,4)}であり、いくつかの中空のドットは{(4,2)、(5,1)}である可能性があります。それらを線形分類器で分類するには、2次元の線形分類器が必要であることに注意してください。これにより、次のような決定ルールが生成されます。

  • e =(x1、x2)
  • if(w1 * x1 + w2 * x2)> C:eがフルドットであると判断します。
  • それ以外の場合:eは中空です。

eの要素の線形結合であるため、分類器は線形であることに注意してください。「w」は「重み」と呼ばれ、「C」は決定しきい値です。上記のように2要素の線形関数は単なる線であるため、図ではHは線です。

さて、n次元の場合に戻ると、線ではうまくいかないことがわかるでしょう。3Dの場合、平面が必要になります:(w1 * x1 + w2 * x2 + w2 * x3)> C、n次元の場合、超平面が必要になります:(w1 * x1 + w2 * x2 + ... + wn * xn)> C、これは想像しがたいことですが、それでも描画することはできません:-)。

于 2011-06-02T06:32:13.310 に答える