無制限の文字列シーケンスと、優先度順に並べられた多数の正規表現があります。シーケンス内の各文字列について、最初に一致する正規表現と一致する部分文字列を見つける必要があります。文字列はそれほど長くはありませんが (<1Kb)、正規表現の数は数百から数千までさまざまです。
この仕事を効率的に行う Java ツールを探しています。この手法は、DFA を先に構築する必要があると思います。
私の現在のオプションは JFLEX です。JFLEX で回避できない問題は、ルールに優先順位がなく、JFLEX がテキストの最も長い部分に一致するルールを探すことです。
私の質問は、私の問題が JFLEX で解決できるかどうかです。そうでない場合は、別のJavaツール/テクニックを提案できますか?