2

classifier.show_most_informative_features(10)MAXent classfierを理解しようとしています。たとえば、次の出力で、列が何を示しているのかわかりません。

train on 460 instances, test on 154 instances accuracy: 0.61038961039 
pos precision: 0.432989690722 
pos recall: 0.893617021277 
neg precision: 0.912280701754 
neg recall: 0.485981308411    
-4.141 need==True and label is 'REL'    
3.395 approves==True and label is 'IRREL'   -
3.308 took==True and label is 'IRREL' 
-1.766 treat==True and label is 'REL' 
-1.488 tired==True and label is 'IRREL' 
-1.295 gave==True and label is 'IRREL' 
0.879 need==True and label is 'IRREL' 
4

1 に答える 1

2

"RELEVANT"との 2 つのラベルがあるようです"IRRELEVANT"。ラベルが 2 つある場合、通常、一方は「1」または正の名前で、もう一方は「-1」または負の名前です。

トレーニング プロセス中に、分類子は 460 のトレーニング インスタンスの特徴を分析し、2 つのラベルを適切に区別する能力に従って重み付けしました。重み付けプロセスの詳細は、選択したアルゴリズムによって異なります。

正の精度:テスト中にラベル 1 として分類された 154 のテスト インスタンスの 43% が実際にラベル 1 を持っています。

正の再現率:テスト セットのラベル 1 インスタンスの 89% が見つかりました。つまり、ラベル 1 として分類されました。

負の精度/負の再現率は同じですが、ラベルが -1 です。

精度: 154 のテスト インスタンスの 61% が正しくラベル付けされました。

フィーチャは、分類の関連性に対応する絶対値に従って並べ替えられます。この場合に最も「役立つ」機能はneedでした。これが真である場合、これはインスタンスのラベルが「RELEVANT」である必要があるという非常に良いヒントです。

于 2013-04-30T23:08:29.893 に答える