ニューラル ネットワークを使用してスパム検出システムを構築しています。私は現在持っているものをどのように進めるか理解できません。
私は-未読メールに既読のフラグが付けられ、tf-idf重み付けを使用してメールベクトルに変換されています。基本的に、私の電子メールメッセージは次のようになります
Email : (Word1,Score1),(Word2,Score2)...
実行後(解析、ステミング、ストップワードの削除、および tf-idf 変換)。バックプロパゲーションによってトレーニングされたフィードバック ネットワークについて読んだことがありますが、これが最も一般的なアプローチのようです。基本的に、私が持っているベクトルの次元をさらに減らす方法と、それを入力として供給する方法。また、隠れ層はどのように動作し、隠れ層ニューロンの数はニューラル ネットワークのパフォーマンスにどのように影響しますか。また、特徴ベクトルは私が持っているものとどう違うのでしょうか? 特徴ベクトルを形成するにはどうすればよいですか?
ありがとうございます。明確になることを楽しみにしています。