機械学習を始めようとしています。
画像内の数字のピクセル値を表すトレーニングデータがいくつかあり、これから決定木をトレーニングしようとしています。始めるための良い方法は何でしょうか?どのツールを検討する必要がありますか(関連ドキュメントのポインターが役立ちます)?
また、パフォーマンスとデシジョンツリーを比較するために、データに対してランダムフォレストをトレーニングしたいと思います。どんなガイダンスも大いに役立つでしょう。
機械学習を始めようとしています。
画像内の数字のピクセル値を表すトレーニングデータがいくつかあり、これから決定木をトレーニングしようとしています。始めるための良い方法は何でしょうか?どのツールを検討する必要がありますか(関連ドキュメントのポインターが役立ちます)?
また、パフォーマンスとデシジョンツリーを比較するために、データに対してランダムフォレストをトレーニングしたいと思います。どんなガイダンスも大いに役立つでしょう。
始めるための最良の方法は、おそらくWekaです。ランダム フォレスト分類子といくつかの決定木 (他の多くのアルゴリズムの中で) の実装を提供することとは別に、データを処理および視覚化するためのツールも提供します。比較的使いやすいGUIが付属しています。
ランダム フォレストはツリーを使用するため、最初にツリーを機能させることをお勧めします。木についてすべて知ったら、森について読むことができます。それは非常に簡単です。ただし、図書館に飛び込むのではなく、機械学習について学ぶことから始めるべきです。エントロピーを最大化する方法を使用して、ブール機能で決定木を使用する方法を理解することから始めます (はるかに簡単です)。そのアルゴリズムを小さなデータセットで手動で実行するのに十分なほど十分に理解したら、実際の価値のある機能で決定木を使用する方法を読んでください。次に、ライブラリをチェックアウトします。