一番上の例を読んでいます: http://www.openfst.org/twiki/bin/view/FST/FstExamples about tokenization.
Mars.fst
この例では、 、Martian.fst
、およびの3 つの fst を作成しman.fst
、いくつかの fst コマンドを手動で実行して、それらを 1 つの大きな変換器にマージします。「火星」、「火星人」、および「人」wotw.syms
という単語は、7102 語からなる から取得されます。
私の質問は、word.fst
すべての 7102 語を 1 つの大きなオートマトンにできるように、すべての 7102 語を作成するスマートな方法があるか、または Martian、Mars、そして男?