多くのカテゴリ (日付、年、時間、名前、句読点、メールなど) に当てはまる単語の種類を見つけようとしています。私はこれを検出するために独自のコードを作成していました (そして動作しました) が、ANTLR や JavaCC などのライブラリを見つけました。
私がやりたいのは、これらのライブラリのタスクですか? はいの場合、何を使用すればよいですか。そうでない場合、これに使用できるものはありますか?
推奨事項は何ですか?JavaCC、ANTRL、他にもありますか? JavaCC がいくつかのクラスを生成しているように見えますが、トークン化のように望ましくないものがあります。