4

CRF++の機能として地名辞典や辞書を使用する方法は?

詳しく説明すると: 人名に対して NER を実行したいとします。一般的に見られる人名を含む地名辞典 (または辞書) を持っているとします。この地名簿を crf++ への入力として使用したいと思います。

名前付きエンティティ認識タスクを実行するために、条件付きランダム フィールド パッケージ crf++ を使用しています。crf ++で一般的に使用される機能を表現する方法を知っています。たとえば、Capitalization を機能として使用したい場合、crf の機能テンプレートに別の列を 1 つ追加して、単語が大文字かどうかを示します。

4

1 に答える 1

6

トークンが辞書/地名辞典にあるかどうかを示す新しい機能を作成できます。セット メンバーシップを確認し、Gazeteer 機能を 1 または 0 に設定するだけです。

于 2015-10-18T16:40:49.913 に答える