私はニューラルネットワークの初心者です。私はパーセプトロンについて学んでいます。私の質問は、なぜ重みベクトルが決定境界(超平面)に垂直なのですか?私は多くの本を参照しましたが、すべてが重みベクトルが決定境界に垂直であると述べていますが、誰も理由を言っていませんか?
誰かが私に本の説明や参照を教えてもらえますか?
私はニューラルネットワークの初心者です。私はパーセプトロンについて学んでいます。私の質問は、なぜ重みベクトルが決定境界(超平面)に垂直なのですか?私は多くの本を参照しましたが、すべてが重みベクトルが決定境界に垂直であると述べていますが、誰も理由を言っていませんか?
誰かが私に本の説明や参照を教えてもらえますか?
重みは、単に分離面を定義する係数です。今のところ、ニューロンを忘れて、N次元の平面の幾何学的定義を考えてみてください。
w1*x1 + w2*x2 + ... + wN*xN - w0 = 0
これはドット積と考えることもできます。
w*x - w0 = 0
ここでw
、とx
は両方とも長さNのベクトルです。この方程式は、平面上のすべての点に当てはまります。w
上記の方程式に定数を掛けることができ、それがまだ成り立つので、ベクトルが単位長になるように定数を定義できることを思い出してください。次に、一枚の紙を取り出して、x-y
軸を描きます(x1
そしてx2
上記の方程式で)。2D
次に、原点の近くに線(の平面)を描きます。w0
は単に原点から平面までの垂線距離であり、原点からw
その垂線に沿って指す単位ベクトルです。ここで、原点から平面上の任意の点にベクトルを描画すると、そのベクトルと単位ベクトルの内積w
は常に次のようになります。w0
したがって、上記の方程式が成り立ちますよね?これは単に平面の幾何学的定義です。平面に垂直なもの()と原点から平面までw
の距離( )を定義する単位ベクトルです。w0
これで、ニューロンは上記と同じ平面を表すだけですが、変数の記述が少し異なります。x
「入力」のコンポーネント、w
「重み」のコンポーネントと呼び、距離w0
をバイアスと呼びます。これですべてです。
実際の質問を少し超えて、平面上の点についてはあまり気にしません。平面のどちら側に点が当たるかを本当に知りたいのです。平面上でw*x - w0
は正確にゼロですが、平面の片側のポイントには正の値があり、反対側のポイントには負の値があります。そこでニューロンの活性化関数が登場しますが、それは実際の質問を超えています。
直感的には、バイナリ問題では、重みベクトルは「1」クラスの方向を指しますが、重みベクトルから離れる方向を指すと「0」クラスが見つかります。したがって、決定境界は重みベクトルに対して垂直に描画する必要があります。
簡略化された例については、画像を参照してください。入力が1つしかないニューラルネットワークがあり、重みが1つあります。重みが-1(青いベクトル)の場合、すべての負の入力が正になるため、負のスペクトル全体が「1」クラスに割り当てられ、正のスペクトルは「0」クラスに割り当てられます。したがって、2軸平面の決定境界は、原点を通る垂直線(赤い線)です。簡単に言うと、重みベクトルに垂直な線です。
この例をいくつかの値で見ていきましょう。すべての合計が0(デフォルトのしきい値)より大きい場合、パーセプトロンの出力はクラス1ですinputs * weights
。それ以外の場合、出力がしきい値0より小さい場合、クラスは0です。入力の値は1です。この単一の入力は-1であるため1 * -1 = -1
、0未満です。したがって、入力にはクラス0が割り当てられます(注:クラス0とクラス1は、クラスAまたはクラスBと呼ばれる可能性があります。入力および重みと混同しないでください)。値)。逆に、入力が-1の場合input * weight
、-1 * -1 = 1
、は0より大きいため、入力はクラス1に割り当てられます。すべての入力値を試すと、この例のすべての負の値の出力が0より大きいことがわかります。したがって、それらはすべてクラス1に属します。すべての正の値の出力は0より小さいため、クラス0に分類されます。すべての正と負の入力値を区切る線(赤い線)を描くと、この線が重みベクトルに垂直であることがわかります。
また、重みベクトルは、必要な出力に合うように入力を変更するためにのみ使用されることに注意してください。重みベクトルがないとどうなりますか?1の入力は、0のしきい値よりも大きい1の出力になります。したがって、クラスは「1」です。
このページの2番目の画像は、2つの入力とバイアスを持つパーセプトロンを示しています。最初の入力の重みは私の例と同じですが、2番目の入力の重みは1です。したがって、対応する重みベクトルと決定境界が、画像に示すように変更されます。また、バイアスが1に追加されたため、決定境界は右に変換されています。
より基本的な線形代数/微積分の観点からの視点は次のとおりです。
平面の一般的な方程式は、Ax + By + Cz = Dです(より高い次元に拡張できます)。法線ベクトルは、次の方程式から抽出できます。[ABC]; これは、平面上にある他のすべてのベクトルに直交するベクトルです。
ここで、重みベクトル[w1 w2 w3]がある場合、w ^ T * x> = 0(正の分類を取得するため)およびw ^ T * x <0(負の分類を取得するため)を実行します。WLOG、w ^ T * x>=dも実行できます。さて、私がこれでどこに行くのかわかりますか?
重みベクトルは、最初のセクションの法線ベクトルと同じです。そして、私たちが知っているように、この法線ベクトル(および点)は平面を定義します:これはまさに決定境界です。したがって、法線ベクトルは平面に直交するため、重みベクトルも決定境界に直交します。
ax + by = 0
、重みベクトルは[a, b]
、特徴ベクトルはです。[x, y]
y = (-a/b)x
、勾配のある決定境界です-a/b
b/a
-1
2年前に質問されましたが、多くの学生が同じ疑問を持っていると思います。同じ質問をしたので、この答えに到達しました。
ここで、X、Yについて考えてみます(デカルト座標系は、点から2本の固定された垂直な有向線までの符号付き距離である数値座標のペアによって平面内の各点を一意に指定する座標系です[ Wikipediaから] )。
Y = 3Xの場合、ジオメトリYはXに垂直であり、w = 3とし、Y = wX、w = Y / Xとします。X間の関係を描画する場合、wは次のように2本の垂直線になります。 XとYの関係を描きます。したがって、常にw係数をXとYに垂直であると考えてください。