2

ラベルの分類にマレットで maxent アルゴを使用しています。maxent 分類子によって予測されたラベルについて、ある種の信頼値を取得できるかどうか疑問に思っていました。私が基本的に必要としているのは、分類子が最も自信を持ってブートストラップに使用する上位 K 個の予測 (トークンごとではなく、データ全体からの) インスタンスです。これを行う方法はありますか?

4

1 に答える 1

2

いずれかの槌分類メソッドを呼び出したときに返される Labeling オブジェクトを見てください。このクラスには、各ラベルの計算されたすべてのスコアが含まれます。最良のスコアが回答になります (これは getBestLabel() メソッドによって返されるスコアです)。問題は、これらのスコアが通常確率ではないということです。私は mallet の maxent 分類器に精通していません。コードを調べて、返されたスコアを何らかの方法で確率に「キャスト」できるかどうか、またはすでに適切な形式になっているかどうかを判断する必要があります。いずれにせよ、あなたがやりたいことは、上位 K スコア間の相対的な差に意味を割り当てることのように思えます。繰り返しますが、これは maxent 分類器の正確な詳細に依存します。そのため、データ セットで実際に返された Labeling オブジェクト インスタンスを見て、最善の判断を下してください。

お役に立てれば!

于 2011-07-07T22:09:27.520 に答える