1

Weka で NaiveBayes 分類を使用して、新しくトレーニングした分類器で分類したいラベルのないデータセットがあります。したがって、実際には、weka の分類モードで [Supplied Test set] オプションを指定すると、ラベルが付いている場合にのみテスト セットが受け入れられ、評価されて精度が得られます。しかし、私が望むのは、train.csv または train.arff ファイルを使用してトレーニングしてから、目に見えないラベルのない新しい test.csv または test.arff ファイルを与えて分類し、トレーニング ファイル内のクラスに応じてラベルを付けることです。しかし、ラベルのないファイルをテスト ファイルとして wweka に提供すると、次のようになります。

エラー: トレーニング セットとテスト セットに互換性がありません

私のトレーニングとテストファイルのサンプル形式は次のとおりです。

Train.csv ファイル:
記事 ストーリー ...ホッケー教室
1 0 …… 0 政治
0 0 .......1 スポーツ
.
.
.
.
. スポーツ

および Test.csv ファイル:

記事 ストーリー ...ホッケー教室
0 1 …… 0      
1 0 .......1      
.
.
.
.
.

では、NaiveBayes 分類子を使用して Weka でラベルのないデータセットを分類するにはどうすればよいでしょうか??

4

3 に答える 3

1

クラスラベルが欠落しているようです。Weka では、トレーニング セットとテスト セットがまったく同じ属性を同じ順序で持つ必要があります。現在、次の 2 つのケースがあります。

テストセットのクラスを知っている

パフォーマンスは、実際のクラス ラベルと予測されたラベルを比較することによって計算されます。トレーニング セットで行ったように、テスト セットでクラス ラベルを提供する必要があります。

テストセットのクラスがわからない

パフォーマンスを計算するには、予測されたクラスと実際のクラスを比較する必要があります。実際のクラスがないと、パフォーマンスを計算できません。クラスを予測することしかできません。class予測だけが必要な場合は、テスト インスタンスに欠損値を含むラベルを追加する必要があります。

于 2013-05-08T10:08:09.540 に答える
0

テスト セットにラベルが付けられていても、Weka は最初の段階ではそれを認識しません。トレーニング データを使用して開発した分類子を使用し、指定したテスト セットに分類子を適用します。次に、分類子が各インスタンス クラスを予測し、Weka が正しい分類または間違った分類を追跡します。したがって、ここで行っていることは、まさにあなたが達成しようとしていることです。エラーは、テスト セットから「クラス」ラベルを削除したと思われるため、トレーニング セットとテスト セットに互換性がないことを示しています。心配しないで。そのままにしておくと、Weka から得られる精度が分類器の実際のパフォーマンスになります。それが役立つことを願っています。

于 2012-04-12T00:11:28.387 に答える
0

すべてを空のままにすることはできません。クラスフィールドに各クラスラベルを少なくとも1つ設定する必要があります(wekaのある種の「手がかり」として)

  • 記事 ストーリー ...ホッケー教室
  • 0 1 …… 0 政治
  • 1 0 .......1 スポーツ
  • 1 1 .......1 ?
  • 1 1 .......1 ?

最初の 2 行は、weka に予測クラスの例を提供します。次に、トレーニングされたモデルを使用して、クラスのないインスタンス (?) と同じくらい予測できます

于 2013-11-28T06:48:22.490 に答える