WEKA で属性選択を実行する場合は、サーチャーと属性エバリュエーターの 2 つのアルゴリズムを考慮する必要があります (これについては後で説明します)。
あなたが言ったように、多分あなたはExhaustive search
それがとても時間がかかるので試すことができないかもしれません. コメントするオプション ( ) は、選択サブセットを作成する別のアプローチであり、評価されるサブセットを選択するためにランダムな反復を行います。Best first
hill climbing
Random search
選択した属性の同じサブセットを取得するのはなぜですか? はRandom search
常に同じサブセットを選択し、評価者が最良のサブセット (最終出力) を決定するためです。しかし、seed
パラメータを変更すると、変更されるはずです。たぶん、または... 多分そうではありません。なんで?アルゴリズムが十分な数の反復を実行すると (異なるシードで開始されますが)、前のサブセットと同じサブセットが取得され (収束)、評価者は前の実行と同じサブセットを選択するためです。
セレクター出力で収束させたくない場合は、 を変更するだけでseed
、より小さな値を選択しsearch percent
て探索を制限し、異なる結果を取得します。
しかし、私の意見では、常に同じ結果が得られるのは、評価者 (使用しているアルゴリズムはわかりません) が、このサブセットが与えられたデータセットに「最適」であると判断したためです。検索方法として、Best first
または a のような別のセレクターを試すこともお勧めします。Genetic search