パーセプトロンアルゴリズムを実装しようとしていますが、以下の点がわかりません。
- 反復回数の理想的な値は何ですか
- このアルゴリズムは大量のデータに適していますか?
- しきい値は反復によって変化しますか?
- はいの場合、最終出力にどのような違いがありますか?
パーセプトロンアルゴリズムを実装しようとしていますが、以下の点がわかりません。
パーセプトロンは特定のアルゴリズムではなく、アルゴリズムのクラスターの名前です。これらのアルゴリズムには 2 つの大きな違いがあります。
1.ルールを統合して起動する
入力ベクトルをx
、重みベクトルをw
、しきい値t
を 、出力値を としますP(x)
。P(x) を計算するさまざまな関数があります。
P(x)
= 1 ( w
* x
>=の場合t
) または 0 (そうでない場合)P(x)
= w
* x
( w
* x
>=の場合t
) または 0 (そうでない場合)P(x)
= t
( w
* x
>=の場合t
) またはw
* x
(0< w
* x
<t
の場合) または 0 (それ以外の場合)P(x)
= 1 / 1+e^( w
* x
)などなど。そのため、しきい値が最終的な出力にどのような違いをもたらすかを言うのは困難です。これは、使用する統合および発火関数に依存するためです。
2.学習ルール
パーセプトロンの学習ルールもさまざまです。最も単純で一般的なのは、
w
-> w
+ a
* x
* ( D(x)
- P(x)
)
ここa
で、 は学習ステップのサイズで、D(x)
は への期待される出力x
です。そのため、反復の理想的な値が何であるかを言うのも困難です。これa
は、トレーニング サンプルの値とその数に依存するためです。
したがって、しきい値は反復によって変化しますか? それも依存します。上記の単純で一般的な学習ルールは、トレーニング中にしきい値を変更しませんが、それを変更する他の学習ルールがいくつかあります。
ところで、このアルゴリズムは大量のデータに適していますか? 特定のデータセットに対する分類器の適合性を測定するための主な指標は、データセットのスケールではなく、データセットの線形分離可能性です。単層パーセプトロンは、線形分離できないデータセットに対してパフォーマンスが非常に悪いことに注意してください。 データセットの規模は問題ではありません。