6

何千もの分類子があることを私たちは知っています、最近私は言われました、何人かの人々は殻adaboostの外のもののようであると言います。

  • より良いアルゴリズムはありますか(その投票のアイデアで)
  • 分類器の最新技術は何ですか。例はありますか?
4

5 に答える 5

6

まず、adaboost は、お気に入りの分類器と組み合わせて (上に) 使用されるメタアルゴリズムです。第 2 に、ある問題領域でうまく機能する分類子が、別の問題領域ではうまく機能しないことがよくあります。ウィキペディアのノー フリー ランチのページを参照してください。したがって、あなたの質問に対する答えはありません。それでも、人々が実際に何を使用しているかを知ることは興味深いかもしれません。

于 2011-02-27T07:26:40.933 に答える
3

WekaとMahoutはアルゴリズムではありません...それらは機械学習ライブラリです。それらには、幅広いアルゴリズムの実装が含まれます。したがって、最善の策は、ライブラリを選択し、いくつかの異なるアルゴリズムを試して、特定の問題に最適なアルゴリズムを確認することです(「最適に機能する」は、トレーニングコスト、分類コスト、および分類精度の関数になります)。

私の場合は、単純ベイズ、k最近傍法、サポートベクターマシンから始めます。これらは、非常に異なるトレードオフを伴う、確立され、よく理解されている方法を表しています。ナイーブベイズは安価ですが、特に正確ではありません。K-NNは、トレーニング中は安価ですが、分類中は(高額になる可能性があります)、通常は非常に正確ですが、オーバートレーニングの影響を受けやすい可能性があります。SVMはトレーニングに費用がかかり、微調整するためのメタパラメータがたくさんありますが、適用するのに費用がかからず、一般に少なくともk-NNと同じくらい正確です。

解決しようとしている問題について詳しく教えていただければ、より焦点を絞ったアドバイスを提供できる可能性があります。しかし、One True Algorithmを探しているだけなら、それはありません。NoFreeLunchの定理はそれを保証します。

于 2011-03-10T19:51:45.303 に答える
2

Apache Mahout (オープン ソース、Java) が勢いを増しているようです。

于 2011-02-28T07:58:20.840 に答える
2

Wekaは非常に人気があり、安定した機械学習ライブラリです。それはかなり前から存在しており、で書かれていJavaます。

于 2011-02-28T08:01:32.390 に答える
1

ハスティ等。(2013, The Elements of Statistical Learning) は、勾配ブースティング マシンが最良の「市販の」方法であると結論付けています。あなたが抱えている問題とは無関係です。定義 (352 ページを参照): 「既製」の方法とは、多大な時間のかかるデータの前処理や学習手順の慎重な調整を必要とせずに、データに直接適用できる方法です。

少し古い意味: 実際、Breiman (NIPS ワークショップ、1996 年) は、ツリーを使用した AdaBoost を「世界で最も優れた市販の分類器」と呼んでいます (Breiman (1998 年) も参照)。

于 2016-04-16T17:57:16.130 に答える