0

私はGATE * SDK * を使用しており、デフォルトの ANNIE Gazetteerを変更して、作成した新しいリスト定義に基づく単純な注釈を含めたいと考えています。

  • リスト定義をGATE-HOME\plugins\ANNIE\resources\gazetteerに追加しました
  • 新しいリスト ファイルを指すように、lists.def ファイルにエントリを追加しました。例 *open_source_software:opensouce*
  • アノテーション スキーマを作成し、GATE-HOME\plugins\ANNIE\resources\schema に追加しました
  • ANNIE をロードしてアプリケーションを実行すると、注釈が自動的に識別されませんが、新しいリスト定義に存在する単語にカーソルを合わせると、ANNIE はその単語を強調表示し、正しい注釈を提案します

ANNIEを訓練しなくてもいいように彼を自動化することは可能ですか?それで、私はそれをプログラム的に行うことができますか?

4

1 に答える 1

2

デフォルトでは、地名辞典はおよび機能Lookupを持つタイプの注釈を作成します。たとえば、次のファイルのエントリです。majorTypeminorType.def

oss.lst:software:open_source

majorTypeリスト内のエントリに対して「software」とminorType「open_source」を使用してルックアップを作成します。Lookup通常のアプローチは、アノテーションを処理して最終的なアノテーションを作成するJAPE ルールを作成することです。

.def行にフィールドを追加することで、Gazetteer から直接他の注釈タイプを作成することができます。

oss.lst:software:open_source::Software

Softwareの代わりにタイプの注釈を作成しますLookup(フィールドは、リスト ファイル名、メジャー タイプ、マイナー タイプ、言語、および注釈タイプです)。しかし、一般的にはLookup、JAPE を使用して最終的な注釈を作成することをお勧めします。これにより、必要に応じて追加のルールを追加できます (地名辞典は、リスト内のあらゆる言及にやみくもに注釈を付けます。これをフィルタリングするためにヒューリスティックが必要になることがよくあります。たとえば、" Apache" は、ほとんどの場合ソフトウェアと見なされる可能性がありますが、"License" という単語が後に続く場合はそうではありません)。

最後に、独自の地名辞典リストや JAPE 規則を追加したい場合は、以下のファイルをplugins/ANNIE直接編集しないことをお勧めします。代わりに、別の場所で独自の lists.defものを作成し、それを Gazetteer PR の別のインスタンスにロードして、パイプラインの適切な場所に挿入します。

于 2014-02-11T23:12:53.037 に答える