1

送信者の名前、受信者、1 語から 20 語の長さの短いメッセージ、およびスパム/非スパムに割り当てられたクラスを含むショート メッセージのデータ セットがあります。この履歴データに基づいて一連の関連付けルールを構築したいと考えています。Apriori アルゴリズムを考えていましたが、データセットに対してアルゴリズムを実行するために短いメッセージを離散化する方法がわかりません。目標は、スパム/非スパムの分類につながるルールを抽出することです

4

1 に答える 1

1

Naive Bayes / SVM は、この種の分類に適しています。各単語を機能として扱うだけです。

于 2012-10-20T13:01:49.280 に答える