次の形式で書かれたARFFファイルがあるかもしれません。
@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
そして、これを実行して、Wekaで単純ベイズ分類器をトレーニングしました。この訓練された分類器が予測を行えるように、どのようにテストセットを作成しますか?ありがとう。
次の形式で書かれたARFFファイルがあるかもしれません。
@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
そして、これを実行して、Wekaで単純ベイズ分類器をトレーニングしました。この訓練された分類器が予測を行えるように、どのようにテストセットを作成しますか?ありがとう。
(実際の)スパムおよび非スパムメールの例を見つけることができる多くのデータリポジトリがあります。次に、スパム/非スパムメールの本文を取得し、適切なラベル(スパムメール本文の場合はスパム、非スパムメール本文の場合はnotspam)を使用して、このような同様のarffファイルを作成します(ただし、今回はarffファイルをテストします)。 )。トレーニングarffファイルを使用すると、分類子モデルを取得できます。そのモデルを保存します。次に、Wekaエクスプローラーの[分類]タブで、[テストセット]ラジオボタンを選択し、テストセットを選択します(ただし、ラベルが表示されます)。次に、トレーニングモデルをロードし、それを右クリックして、[テストセットで再評価]を選択します。これで完了です。