1

多くの (100 以上) クラスを持つ固有表現認識システムを開発します。それらの頻度がほぼ等しいと仮定すると、どのアルゴリズムが最適に機能する必要がありますか? CRFがどのように機能するかについての私の理解(悲しいことに、理想からはほど遠い)によると、ここでは問題ないはずです。しかし、いくつかの情報源 ( Google ブックス) で別の意見を見つけました。

では、CRF は膨大な数のクラスを持つ NER に適したアルゴリズムですか?

4

1 に答える 1

0

ここではどのような種類のクラスについて話しているのですか? 恥ずかしがらないでください:)

おそらく、階層的なアプローチを使用するのが最善です。

  1. 「製品」、「人」、「場所」などの少数のルート クラスを用意します。最初のパスは、どれがどれであるかを把握します。

  2. 次に、ルート クラスごとに、「自動車製品」、「電子製品」などのサブクラスを作成します。

于 2014-08-10T21:30:35.803 に答える