名前付きエンティティの認識とチャンカーを使用して、NLTK でいくつかの作業を行っています。そのために使用する分類子を再トレーニングしたnltk/chunk/named_entity.py
ところ、次の測定値が得られました。
ChunkParse score:
IOB Accuracy: 96.5%
Precision: 78.0%
Recall: 91.9%
F-Measure: 84.4%
しかし、この場合の IOB Accuracy と Precision の正確な違いは何なのかわかりません。実際、特定の例については、ドキュメント(here)で次のことを見つけました。
IOB タグの精度は、単語の 3 分の 1 以上が O でタグ付けされていること、つまり NP チャンクに含まれていないことを示しています。ただし、タガーはチャンクを見つけられなかったため、精度、再現率、および f 値はすべてゼロです。
では、IOB の精度が O ラベルの数だけである場合、その例では、チャンクがなく、同時に IOB の精度が 100% ではないのはなぜでしょうか?
前もって感謝します