6

Weka で属性選択を実行しようとしています。InfoGainAttributeEval は相互情報量に相当すると読んだので評価器として、Ranker は検索方法として使用したいと思います。トレーニング セットとテスト セットの両方に対して属性選択を実行する必要がありますか? また、N パラメータの正しい値を選択するにはどうすればよいですか?

お時間をいただき、ありがとうございました。

ナディア

4

1 に答える 1

1

トレーニングとテストで別々に属性選択を適用すると、異なる属性が選択され、互換性がなくなる可能性があります。したがって、両方のセットが同じ属性を持つようにするには、データセット全体に属性選択を適用する必要があります。最も有用な属性を選択したら、データをトレーニング セットとテスト セットに分割します。

どの値-Nを使用するかについては、属性の合計量を使用します。これにより、すべての属性のランク付けされたリストが作成され、すべての属性のさまざまなスコアを自分で評価できます。次に、有用な情報を保持する属性を分離する明確なしきい値を見つけて、何も追加しない属性から分類器をトレーニングすることができます。次に、オプションを使用してこのしきい値を設定し-Tます。

于 2012-09-17T13:48:45.580 に答える