3

ベイジアンネットワークを理解しようとしています。10 個の属性を持つデータ ファイルがあり、このデータ テーブルの混同テーブルを取得したいので、すべてのフィールドの tp、fp、fn、tn を計算する必要があると考えました。本当ですか?それなら、ベイジアンネットワークのために私がしなければならないことです。

本当にいくつかのガイダンスが必要です、私は迷っています。

4

3 に答える 3

4

プロセスは通常次のようになります。

  • 分類器をトレーニングするために使用するラベル付きデータ インスタンスがいくつかあるため、新しいラベルなしインスタンスのクラスを予測できます。
  • 選択した分類器 (ニューラル ネットワーク、ベイズ ネット、SVM など) を使用して、トレーニング データを入力としてモデルを構築します。
  • この時点で、通常、モデルをデプロイする前にパフォーマンスを評価します。そのため、以前に使用されていないデータのサブセット (テスト セット) を使用して、これらのインスタンスのモデル分類を実際のクラスのモデル分類と比較します。これらの結果を要約する良い方法は、インスタンスの各クラスがどのように予測されるかを示す混同行列です。

二項分類タスクの場合、規則では、1 つのクラスを正として、もう 1 つのクラスを負として割り当てます。したがって、混同行列から、正として正しく分類された正のインスタンスのパーセンテージは、真陽性 (TP) 率として知られています。他の定義は同じ規則に従います...

于 2010-06-04T20:26:57.813 に答える
3

混同行列は、分類器、任意の分類器のパフォーマンスを評価するために使用されます。

于 2010-06-03T16:56:34.567 に答える
0

あなたが求めているのは、2つ以上のクラスを持つ混同行列です。手順は次のとおりです。

  • クラスごとに分類器を作成します。トレーニング セットは、クラス内のドキュメントのセット (正のラベル) とその補数 (負のラベル) で構成されます。
  • テスト ドキュメントが与えられたら、各分類子を個別に適用します。
  • 最大スコア、最大信頼値、または最大確率を持つクラスにドキュメントを割り当てます

詳細については、次の論文を参照してください。

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.
于 2016-02-03T15:11:22.960 に答える