こんにちは、私が開発しようとしている電子メールを分類しようとするシステムについて概念的な質問があります。スパムではない大規模なセット (>100k) のメッセージと、未分類のメッセージの大規模なセットがあります。スパムのデータセットを持たずにスパムを検出する方法 (おそらくベイジアン) を使用することは可能ですか? スパムを分類する必要はありますか?
1 に答える
1
はい、できます。結果は、監視された方法よりも悪い可能性が高くなります。一般的な問題は、多くの場合、異常検出と呼ばれます。アイデアは、データのモデルを作成し、新しいインスタンスごとに、それがこのモデルからのものかどうかを決定することです。それを行うには多くの方法があり、適切な方法を選択するのは困難です。ここから勉強を始めることができます。
于 2013-05-29T08:20:06.250 に答える