Python 用の Helsinki Finite State Technology (HFST) を使用して、Finite State Transducer をセットアップしようとしています。
単語の最初の文字が「o」の場合、出力は「ポジティブ」になり、同じ単語に続く文字がある場合は、正規表現を使用してすべての文字を空に出力します。
ただし、「お」だけは受け付けません。
e.g. "oa" = "positive" , empty
"aa" = 0
"o" = 0
HFSTチュートリアルからこれまでに得たもの:
t = hfst.HfstBasicTransducer()
t.add_state(1)
t.add_state(2)
tr = hfst.HfstBasicTransition(1,"o","positive",0.0)
tr2 = hfst.regex("?:0")
t.add_transition(0,1,tr)
t.add_transition(1,2, tr2)