4

私はHTMLファイルの解析にJsoupを使用してきましたが、これまでのところ、それは素晴らしい仕事をしています。ただし、サーバータグ(<%...%>)を解析することはできません。私はそれを拡張することに決めましたが、そのパーサーとそれらすべてのプライベート/パッケージレベルのクラス(つまり、TreeBuilder、TransitionState ...など)を拡張する簡単な方法を見つけることができません...

そこで、サーバータグを解析できると主張しているJerichoを調べ始めましたが、ドキュメントが非常に貧弱で、簡単に始めることすらできません。そして、そのAPIはJsoupが提供するものほどフレンドリーではないようです-いくつかのノードを抽出して移動するのはそれほど簡単ではありません...

誰かが以前に同じような状況にあるのだろうか、そしてあなたはそれをどのように解決するのだろうか?つまり、JavaでJSPファイルを解析したいだけです。(まあ..自分で実装するように言わないでください; p)

4

1 に答える 1

1

最後に、回避策を取得します。1)サーバーコードを正しく実行できるように、サーバーコードブロックをHTMLコメントブロックに配置します。2)Jsoupは、内部に何も触れることなく、ブロック全体をHTMLコメントノードとして処理できます。

例えば

<!--
<%@ page language="java" errorPage="/error.jsp" pageEncoding="UTF-8" contentType="text/html;charset=UTF-8" %>
<%@ page import="com.systemcrossed.groupbuystart.webapp.display.DisplayHelper" %>
<%@ page import="com.systemcrossed.groupbuystart.webapp.util.JsonUtil" %>
<%@ page import="org.apache.commons.lang.StringEscapeUtils" %>
<%@ include file="/_sys/pages/public/incl/jspCommon.jsp" %>
-->
<!--<%
    // Java code here
%>-->
<html>
<head>
    ... html stuff

今はうまくいきます!同じ問題を抱えているpplが助けを得ることができることを願っています!;)

于 2012-11-06T00:15:46.200 に答える