ウェブページからの広告である画像を検出するアプリを構築しようとしています。それらを検出したら、クライアント側での表示を許可しません。
基本的に、バックプロパゲーション アルゴリズムを使用して、次のデータセットを使用してニューラル ネットワークをトレーニングしています: http://archive.ics.uci.edu/ml/datasets/Internet+Advertisements。
しかし、そのデータセットではありません。属性値が非常に高い。実際、このプロジェクトのメンターの 1 人が、これほど多くの属性を使用してニューラル ネットワークをトレーニングすると、トレーニングに時間がかかると言っていました。入力データセットを最適化する方法はありますか? それとも、それだけ多くの属性を使用する必要がありますか?