0

たとえば、10000 を超えるデータ ポイント (トレーニング セットのサイズ) を持つトレーニング セットが与えられ、100000 を超える機能がなく、クラス ラベルが約 20 に近い場合、この場合、どの分類器 (デシジョン ツリー、svm、ナイーブなどの方法)ベイズ、ニューラル ネットワーク、ブースティング) を使用すると、テスト データのクラス ラベルを分類する精度が最も高くなります。

4

1 に答える 1

5

コメントで述べたように、一般的なルールはありません。

ただし、かなり多数のトレーニング例と非常に多数の機能があるため、機能の希薄性を促進する何らかの分類器が必要になるでしょう。最初に、L1 またはエラスティック ネット ペナルティを使用して SGD 線形分類器を試してみます。

Andreas Mueller の試すアルゴリズムのフローチャートも参照してください。

于 2013-02-06T07:50:19.007 に答える