Weka で属性選択を実行したいのですが、データセットがかなり大きく、プログラムの実行にかなりの時間がかかります。そのため、見つかった現在の最適な属性セットを確認したいと考えています。どうすればいいのですか?たとえば、遺伝子検索には「レポート頻度」パラメーターがありますが、検索全体が終了した後にすべての結果が表示されます。これは私が必要とするものではありません。
プログレスバーがないので、どれくらい待たなければならないのかもわかりません...
Weka で属性選択を実行したいのですが、データセットがかなり大きく、プログラムの実行にかなりの時間がかかります。そのため、見つかった現在の最適な属性セットを確認したいと考えています。どうすればいいのですか?たとえば、遺伝子検索には「レポート頻度」パラメーターがありますが、検索全体が終了した後にすべての結果が表示されます。これは私が必要とするものではありません。
プログレスバーがないので、どれくらい待たなければならないのかもわかりません...
機能または属性の選択は、データ マイニングおよび機械学習の分野では標準的な問題です。
適切な属性セットを選択する場合は、品質に基づいて属性をランク付けして、データを前処理する必要があります。p-metricやt-statisticなどのランキング手法は、統計的尺度に基づいており、人気があります。属性の性質に関する何らかの直感なしに、大きなセットから属性をランダムに選択するだけでは、単純に進むことはできません。
データセット全体で属性選択を実行する必要がない場合は、データセットの小さなサンプルを使用して (単純に ARFF ファイルを編集して) 属性選択を実行できます。