-1

機械学習を始めようとしています。

画像内の数字のピクセル値を表すトレーニングデータがいくつかあり、これから決定木をトレーニングしようとしています。始めるための良い方法は何でしょうか?どのツールを検討する必要がありますか(関連ドキュメントのポインターが役立ちます)?

また、パフォーマンスとデシジョンツリーを比較するために、データに対してランダムフォレストをトレーニングしたいと思います。どんなガイダンスも大いに役立つでしょう。

4

2 に答える 2

2

始めるための最良の方法は、おそらくWekaです。ランダム フォレスト分類子といくつかの決定木 (他の多くのアルゴリズムの中で) の実装を提供することとは別に、データを処理および視覚化するためのツールも提供します。比較的使いやすいGUIが付属しています。

于 2013-01-09T14:41:12.860 に答える
0

ランダム フォレストはツリーを使用するため、最初にツリーを機能させることをお勧めします。木についてすべて知ったら、森について読むことができます。それは非常に簡単です。ただし、図書館に飛び込むのではなく、機械学習について学ぶことから始めるべきです。エントロピーを最大化する方法を使用して、ブール機能で決定木を使用する方法を理解することから始めます (はるかに簡単です)。そのアルゴリズムを小さなデータセットで手動で実行するのに十分なほど十分に理解したら、実際の価値のある機能で決定木を使用する方法を読んでください。次に、ライブラリをチェックアウトします。

于 2013-01-09T18:30:21.573 に答える