私はHTMLファイルの解析にJsoupを使用してきましたが、これまでのところ、それは素晴らしい仕事をしています。ただし、サーバータグ(<%...%>)を解析することはできません。私はそれを拡張することに決めましたが、そのパーサーとそれらすべてのプライベート/パッケージレベルのクラス(つまり、TreeBuilder、TransitionState ...など)を拡張する簡単な方法を見つけることができません...
そこで、サーバータグを解析できると主張しているJerichoを調べ始めましたが、ドキュメントが非常に貧弱で、簡単に始めることすらできません。そして、そのAPIはJsoupが提供するものほどフレンドリーではないようです-いくつかのノードを抽出して移動するのはそれほど簡単ではありません...
誰かが以前に同じような状況にあるのだろうか、そしてあなたはそれをどのように解決するのだろうか?つまり、JavaでJSPファイルを解析したいだけです。(まあ..自分で実装するように言わないでください; p)