通常のテキスト用の語彙パーサーを書きたいと思っています。したがって、次のトークンを検出する必要があります。
1) 単語 2) 数字 3) ドットおよびその他の句読点 4) 「...」 「!?」「!!!」等々
項目ごとに if else 条件を書くのは簡単ではないと思います。c# 用の有限ステート マシン ジェネレーターはありますか? 私は ANTLR などを知っていますが、これらのツールの使用方法を学ぼうとしている間に、独自の「ifelse」FSM を作成できます。
私は次のようなものを見つけたいと思っています:
FiniteStateMachine.AddTokenDefinition(":)","smile");
FiniteStateMachine.AddTokenDefinition(".","dot");
FiniteStateMachine.ParseText(text);