送信者の名前、受信者、1 語から 20 語の長さの短いメッセージ、およびスパム/非スパムに割り当てられたクラスを含むショート メッセージのデータ セットがあります。この履歴データに基づいて一連の関連付けルールを構築したいと考えています。Apriori アルゴリズムを考えていましたが、データセットに対してアルゴリズムを実行するために短いメッセージを離散化する方法がわかりません。目標は、スパム/非スパムの分類につながるルールを抽出することです
送信者の名前、受信者、1 語から 20 語の長さの短いメッセージ、およびスパム/非スパムに割り当てられたクラスを含むショート メッセージのデータ セットがあります。この履歴データに基づいて一連の関連付けルールを構築したいと考えています。Apriori アルゴリズムを考えていましたが、データセットに対してアルゴリズムを実行するために短いメッセージを離散化する方法がわかりません。目標は、スパム/非スパムの分類につながるルールを抽出することです