次の形式のデータが必要です
(u'Melbourne', u'NP', u'B-LOC'),
(u'(', u'Fpa', u'O'),
(u'Australia', u'NP', u'B-LOC'),
(u')', u'Fpt', u'O'),
(u',', u'Fc', u'O'),
私が持っているのはtxtファイルだけです。NERタスクのCRFモデルにはこのデータが必要です。Python 用の crf スイートを使用する予定ですが、トレーニング データにラベルを付ける方法がよくわかりません。pos タグを付けるだけで済みますが、名前付きエンティティを追加するには、トレーニング データに 2 つのカスタム ラベルを付ける必要があるためです。