この論文のように、中国語の単語セグメンタを構築しようとしています。私の理解が正しければ、彼らは CRF++ で 2 タグ セグメンテーション アプローチを使用しています。私の質問は、CRF++ の機能テンプレートとして、その論文 (egT(-1)C(0)T(0)) でタグ遷移を行う方法ですか? たとえば、そのようなトレーニング データの場合:
共B
同 M
創B
造M
美B <- 現在の単語
好M
B
新B
世B
紀M
CRF++ で機能 T(-1)C(0)T(0) -> M/美/B を持つことは可能ですか? U01:%x[-1,1]/%x[0,0]/%x[0,1] などの機能テンプレートを追加しようとしましたが、失敗しました。B/I タグはテスト データ (生の中国語の文章など) でタグ付けしたいタグであるため、私も混乱しています。なぜこのタグを論文の特徴として使用できるのでしょうか? それとも私は何かを誤解しましたか?