3

私は機能セット(40の機能)のリストを持っています。私の考えは、最初に、取得できるすべての組み合わせで分類子を評価することでした。しかし、いくつかの計算を行った後、組み合わせが数百万に達することがわかりました!! したがって、それは永遠にかかります!!!!

ランダム検索方法を使用してランダムな機能を選択する機能について読みました。ただし、ランダム検索を実行するたびに、同じ機能セットが得られました。シード番号やオプションを変更する必要がありますか?

また、ランダム検索の使用は効果的であり、すべての組み合わせを選択するアプローチに置き換えることができますか?

私はあなたの助けの専門家に感謝します。

よろしくお願いします。

アフマド

4

1 に答える 1

4

WEKA で属性選択を実行する場合は、サーチャーと属性エバリュエーターの 2 つのアルゴリズムを考慮する必要があります (これについては後で説明します)。

あなたが言ったように、多分あなたはExhaustive searchそれがとても時間がかかるので試すことができないかもしれません. コメントするオプション ( ) は、選択サブセットを作成する別のアプローチであり、評価されるサブセットを選択するためにランダムな反復を行います。Best firsthill climbingRandom search

選択した属性の同じサブセットを取得するのはなぜですか? はRandom search常に同じサブセットを選択し、評価者が最良のサブセット (最終出力) を決定するためです。しかし、seedパラメータを変更すると、変更されるはずです。たぶん、または... 多分そうではありません。なんで?アルゴリズムが十分な数の反復を実行すると (異なるシードで開始されますが)、前のサブセットと同じサブセットが取得され (収束)、評価者は前の実行と同じサブセットを選択するためです。

セレクター出力で収束させたくない場合は、 を変更するだけでseed、より小さな値を選択しsearch percentて探索を制限し、異なる結果を取得します。

しかし、私の意見では、常に同じ結果が得られるのは、評価者 (使用しているアルゴリズムはわかりません) が、このサブセットが与えられたデータセットに「最適」であると判断したためです。検索方法として、Best firstまたは a のような別のセレクターを試すこともお勧めします。Genetic search

于 2013-01-29T07:28:23.847 に答える