JSPXに変換しようとしているJSPファイルが多数(> 1500)あります。整形式のJSPを解析してJSPXに変換するツールを使用していますが、JSPのすべてが整形式ではありません:)
私の解決策は、JSPを前処理し、乱雑なコードを変換して、ツールがそれらを正しく解析するようにすることです。私が解決しようとしている主な問題は、引用符で囲まれていない属性値の問題です。例:
<INPUT id="foo" size=1>
<input id=body size="2">
これらを見つけるための私の現在の正規表現は(Java文字列形式で):
"(\\w+)=([^\"' >]+)"
そして、私の置換文字列は(Java文字列形式で):
"$1=\"$2\""
これは、インラインスクリプトレットを含むいくつかのパターンを除いて、うまく機能します。例えば:
<INPUT id=foo value="<%= someBean.method("a=b") %>">
この場合、私のパターンは文字列リテラル「a = b」と一致しますが、これは実行したくありません。私がしたいのは、正規表現が<%と%>の間のすべてを無視することです。私がやろうとしていることを実行する正規表現はありますか?
編集:タイトルを変更して、正規表現を使用してHTML / JSPを解析しようとしていないことを明確にしました...解析用の入力を準備するために、単純な構文変換を行っています。