初歩的な質問なので、冷静に考えてください。
私はデータ マイニングの分野に不慣れで、このトピックに頭を悩ませようとしています。現在、インスタンスをより適切に分類できるように、既存のモデルを改良しようとしています。問題は、私のモデルに約 480 の属性があることです。それらのすべてが関連しているわけではないことは確かですが、どれが本当に重要であるかを指摘するのは難しいです.
問題は、有効なトレーニング セットとテスト セットがあれば、分類の質に影響を及ぼさないと思われる属性を破棄する、ある種のデータ マイニング アルゴリズムを使用できるかということです。
ウェカを使用しています。