machine-learning - デシジョンツリーのトレーニング

Question

機械学習を始めようとしています。

画像内の数字のピクセル値を表すトレーニングデータがいくつかあり、これから決定木をトレーニングしようとしています。始めるための良い方法は何でしょうか？どのツールを検討する必要がありますか（関連ドキュメントのポインターが役立ちます）？

また、パフォーマンスとデシジョンツリーを比較するために、データに対してランダムフォレストをトレーニングしたいと思います。どんなガイダンスも大いに役立つでしょう。

score 2 · Accepted Answer

始めるための最良の方法は、おそらくWekaです。ランダムフォレスト分類子といくつかの決定木 (他の多くのアルゴリズムの中で) の実装を提供することとは別に、データを処理および視覚化するためのツールも提供します。比較的使いやすいGUIが付属しています。

score 0 · Accepted Answer

ランダムフォレストはツリーを使用するため、最初にツリーを機能させることをお勧めします。木についてすべて知ったら、森について読むことができます。それは非常に簡単です。ただし、図書館に飛び込むのではなく、機械学習について学ぶことから始めるべきです。エントロピーを最大化する方法を使用して、ブール機能で決定木を使用する方法を理解することから始めます (はるかに簡単です)。そのアルゴリズムを小さなデータセットで手動で実行するのに十分なほど十分に理解したら、実際の価値のある機能で決定木を使用する方法を読んでください。次に、ライブラリをチェックアウトします。

machine-learning - デシジョンツリーのトレーニング

2 に答える 2

Related

Reference