1

GWT で書かれた HTML ページのコンテンツを解析したいと考えています。Jericho HTML コンテンツ パーサーを使用して解析しようとしましたが、問題はページ ソースにコンテンツがないことです。GWT ページについて調査した結果、GWT ページは Java で記述されており、GWT コンパイラーは Java コードから複雑な構造の js ページを作成して HTML コンテンツをブラウザーに表示することを知りました。

これらのタイプのページを解析する方法はありますか?

4

2 に答える 2

1

コードがコンパイルされている場合(コードは通常、本番環境で使用するためにこのモードでコンパイルされます)、作成されたファイルは人間が読み取れないOBF - Obfuscated modeため、非常に困難になります。JS

このリンクは、GWT Compiler をよりよく理解するのに役立ちます。

編集

どうぞ。これも役立つかもしれません。ここに方法が記載されていますDe-obfuscate the Javascript

EDIT2

GWT-Penetration-Testing-Toolset - このツールを確認してください。

于 2012-04-26T10:22:13.913 に答える
1

あらゆる「単一ページ Web アプリケーション」 ( GWT で構築されていないTwitter など) と同様に、JavaScript コードを実行してから DOM をスクレイピングする必要があります。

これは、 HtmlUnitPhantomJS 、または同様のツールを使用して簡単に(すべて相対的に) 実行できます。

于 2012-04-26T13:41:43.553 に答える