1

Weka で属性選択を実行したいのですが、データセットがかなり大きく、プログラムの実行にかなりの時間がかかります。そのため、見つかった現在の最適な属性セットを確認したいと考えています。どうすればいいのですか?たとえば、遺伝子検索には「レポート頻度」パラメーターがありますが、検索全体が終了した後にすべての結果が表示されます。これは私が必要とするものではありません。

プログレスバーがないので、どれくらい待たなければならないのかもわかりません...

4

2 に答える 2

1

機能または属性の選択は、データ マイニングおよび機械学習の分野では標準的な問題です。

適切な属性セットを選択する場合は、品質に基づいて属性をランク付けして、データを前処理する必要があります。p-metrict-statisticなどのランキング手法は、統計的尺度に基づいており、人気があります。属性の性質に関する何らかの直感なしに、大きなセットから属性をランダムに選択するだけでは、単純に進むことはできません。

于 2013-08-22T06:15:45.753 に答える
0

データセット全体で属性選択を実行する必要がない場合は、データセットの小さなサンプルを使用して (単純に ARFF ファイルを編集して) 属性選択を実行できます。

于 2013-07-31T13:08:41.850 に答える