machine-learning - Weka属性選択

Question

Weka で属性選択を実行しようとしています。InfoGainAttributeEval は相互情報量に相当すると読んだので評価器として、Ranker は検索方法として使用したいと思います。トレーニングセットとテストセットの両方に対して属性選択を実行する必要がありますか? また、N パラメータの正しい値を選択するにはどうすればよいですか?

お時間をいただき、ありがとうございました。

ナディア

score 1 · Accepted Answer

トレーニングとテストで別々に属性選択を適用すると、異なる属性が選択され、互換性がなくなる可能性があります。したがって、両方のセットが同じ属性を持つようにするには、データセット全体に属性選択を適用する必要があります。最も有用な属性を選択したら、データをトレーニングセットとテストセットに分割します。

どの値-Nを使用するかについては、属性の合計量を使用します。これにより、すべての属性のランク付けされたリストが作成され、すべての属性のさまざまなスコアを自分で評価できます。次に、有用な情報を保持する属性を分離する明確なしきい値を見つけて、何も追加しない属性から分類器をトレーニングすることができます。次に、オプションを使用してこのしきい値を設定し-Tます。

machine-learning - Weka属性選択

1 に答える 1

Related

Reference