0

ウェブページには、いくつかの洗練された方法で難読化されたコンテンツがあります (少なくとも私にとっては)。ページのソースから解読できません。とにかく、ページ上のリンクをクリックすると、onclick Java 関数が呼び出され、ページが読み取り可能になります。その時点で、ブラウザで生成されたソースも読み取り可能になります。

Firefox にページをロードし、リンクをクリックして、チップ化されていない html を取得するプログラミング ツール (mechanize や sth.、できれば perl など) はありますか?

この問題を攻撃する方法について何か提案はありますか?

4

3 に答える 3

1

Chrome を使用してみて、開発者ツールの JavaScript ビューアで deobfuscate source オプションを確認してください。

于 2011-07-14T19:20:30.173 に答える
0

難読化解除されたコードを表示するには、 Firebugを使用します。

ソースを表示すると、ブラウザーは現在の DOM ではなく、元のソースを表示します。Firebug でソースを表示すると、ブラウザが現在表示している現在のソースが表示されます。

このアプローチは、HTML を表示したい場合にのみ機能し、プログラムによる抽出が必要な場合には機能しません。

于 2010-12-01T22:31:23.820 に答える
0

firefox 用のグリースモンキー アドオンを試してください。

たとえば、Firefox でページをロードするたびに、そのボタンをクリックする小さな JavaScript 関数を作成できます。開始するには、userscripts.org をチェックしてください。

これは (ブラウザ内で) 単一のクライアントに対してのみ機能し、それは you です。

完全に自動化する必要がある場合は、Selenium テストケースの記録を試すことができます。これには、別の Firefox アドオン「Selenium IDE」を使用でき (Microsoft Office のベテランはこれを「マクロ レコーダー」と呼んでいます)、記録したテストケースを Perl コードに変換することもできます。

(テストケースを実行するには、Firefox を起動してリンクをクリックする別の小さなコンポーネントである selenium rc (Java ベースのサーバー) を起動する必要があります。

于 2010-12-01T22:31:32.030 に答える