machine-learning - ANN、SVM、およびKNN分類器の違いは何ですか？

Question

リモートセンシング画像分類を行っています。私はオブジェクト指向の方法を使用しています。最初に画像をさまざまな領域にセグメント化し、次に色、形状、テクスチャなどの領域から特徴を抽出します。リージョン内のすべての特徴の数は30であり、通常は全部で2000のリージョンがあり、クラスごとに15のサンプルを持つ5つのクラスを選択します。

要約すれば：

サンプルデータ1530
テストデータ197530

適切な分類子を選択するにはどうすればよいですか？3つの分類器（ANN、SVM、およびKNN）がある場合、より適切な分類のためにどちらを選択する必要がありますか？

score 7 · Accepted Answer

KNNは、パラメータ化して実装するための最も基本的な機械学習アルゴリズムですが、@ etovによってほのめかされているように、トレーニングデータサイズが小さいため、SVMよりもパフォーマンスが優れている可能性があります。ANNは、不十分なトレーニングデータによっても制限されていることが観察されています。ただし、KNNは、正確なトレーニングデータが比較的離散的なクラスターを形成する必要があることを除いて、データに関して最小限の数の仮定を行います。ANNとSVMは、特に複数のデータセットを使用してプロセスを繰り返し、データが線形分離可能（SVM）であるなどの特定の仮定に依存する場合は、パラメータ化が難しいことで有名です。

また、ランダムフォレストアルゴリズムは実装が簡単で、トレーニングデータサイズの影響を比較的受けにくいため、お勧めしますが、非常に小さいトレーニングデータサイズを使用しないことをお勧めします。

scikit-learnモジュールにはこれらのアルゴリズムが含まれており、大きなトレーニングデータサイズに対応できるため、トレーニングデータサンプルの数を増やすことができます。確実に知るための最良の方法は、@ etovによって提案されているように、自分でそれらを調査することです。

score 2 · Accepted Answer

「サンプルデータ」が列車セットの場合、非常に小さいように見えます。まず、クラスごとに15を超える例を使用することをお勧めします。

コメントで述べたように、アルゴリズムを問題に一致させるのが最善であるため、単純にテストして、どのアルゴリズムがより適切に機能するかを確認できます。しかし、最初に、SVMをお勧めします。SVMは、小さな列車セットではKNNよりもうまく機能し、選択肢が少ないため、一般的にANNよりも訓練が簡単です。

score 1 · Accepted Answer

以下のマインドマップをご覧ください

KNN： KNNは、非テキストデータの場合、サンプルサイズが100Kレコード未満の場合に良好に機能します。精度が高くない場合は、すぐにSVC（SVMのサポートベクター分類器）に移動してください。

SVM：サンプルサイズが100Kレコードを超える場合は、SGDClassifierを使用してSVMを選択します。

ANN： ANNは時間の経過とともに進化し、強力です。ANNとSVMの両方を組み合わせて使用して画像を分類できます

詳細については、semanticscholar.orgをご覧ください。

machine-learning - ANN、SVM、およびKNN分類器の違いは何ですか？

3 に答える 3

Related

Reference