CRF++の機能として地名辞典や辞書を使用する方法は?
詳しく説明すると: 人名に対して NER を実行したいとします。一般的に見られる人名を含む地名辞典 (または辞書) を持っているとします。この地名簿を crf++ への入力として使用したいと思います。
名前付きエンティティ認識タスクを実行するために、条件付きランダム フィールド パッケージ crf++ を使用しています。crf ++で一般的に使用される機能を表現する方法を知っています。たとえば、Capitalization を機能として使用したい場合、crf の機能テンプレートに別の列を 1 つ追加して、単語が大文字かどうかを示します。