私はこれに対する解決策を何週間も探していました.GATEを使用して分類しようとしているドキュメント(約95)がいくつかあります. これらを training_corpus という名前の 1 つのコーパスに入れましたが、ANNIE がコーパスに注釈を付けた後、各ファイルに戻り、ドキュメント内のすべてのトークンを選択し、Mention という注釈を作成する必要があります。特徴のタイプと値はクラスです。ドキュメントのために。例えば:
type Start End id Features
Mention 0 70000 2588 {type=neg}
JAPEでこれを自動的に行う方法はありますか? 基本的には、すべてのトークンを選択し、feature(type=class) で新しいアノテーションを作成したいと考えています。また、クラスがドキュメントに追加されます。ドキュメントが多いので、JAPEはドキュメント名からクラスを抽出し、メンション機能の値に設定できます。ドキュメント名の例は neg_data1.txt なので、アノテーションは Mention.type = neg? になります。
どんな助けでも大歓迎です。ありがとう