0

次の形式で書かれたARFFファイルがあるかもしれません。

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam

そして、これを実行して、Wekaで単純ベイズ分類器をトレーニングしました。この訓練された分類器が予測を行えるように、どのようにテストセットを作成しますか?ありがとう。

4

1 に答える 1

1

(実際の)スパムおよび非スパムメールの例を見つけることができる多くのデータリポジトリがあります。次に、スパム/非スパムメールの本文を取得し、適切なラベル(スパムメール本文の場合はスパム、非スパムメール本文の場合はnotspam)を使用して、このような同様のarffファイルを作成します(ただし、今回はarffファイルをテストします)。 )。トレーニングarffファイルを使用すると、分類子モデルを取得できます。そのモデルを保存します。次に、Wekaエクスプローラーの[分類]タブで、[テストセット]ラジオボタンを選択し、テストセットを選択します(ただし、ラベルが表示されます)。次に、トレーニングモデルをロードし、それを右クリックして、[テストセットで再評価]を選択します。これで完了です。

于 2012-03-20T01:15:44.313 に答える