0

google chrome などのブラウザで、ページの情報を取得したいときは、ページのソースを表示を選択するだけですが、javascript を使用する一部のサイトではそれができないため、ボタンなどの任意の要素でそれを発見し、検査を選択します必要な情報が表示されます。これは非常に優れていますが、たとえば html を使用する単純なページの場合は、これを自動的に実行したいと考えています。wget を使用してページをテキストに保存し、後で分析しますが、 javascript と css を使用するのは不可能なので、必要な情報を取得してテキストに保存するためのツールまたは方法はありますか? サイトと要素 (ボタン) を指定すると、コードがダウンロードされて保存されます。テキストへ

4

1 に答える 1

1

クロムを使用している場合はCtrl + Shift + J、開発者ツール ウィンドウを開くことができます。左上のアイコン (Elements) をクリックして、JavaScript の変更後の DOM を確認します。

IE(7以降だと思います)ではF12、同様のウィンドウを開くために使用します。

Ctrl + Shift +Iまた、FireFox では、同様のウィンドウを開くために使用できます。

そして、このプロセスを自動化するには、http://www.phantomjs.org/を使用してみてください(ここで提案されているように: wget + JavaScript? )

編集:

IE には、現在の DOM を保存する [保存] ボタンがあります。

ここに画像の説明を入力

FireFox では、Ctrl + Shift + IプレスCtrl + Sを押した後、現在の DOM が保存されます。

編集2:

PhantomJS をダウンロードし、script.jsこれを貼り付けという名前のファイルを作成します。

system = require('system');
var page = new WebPage();
page.open(system.args[1], function (status) {
    if(status == 'success') {
        html = page.evaluate(function() {
            return document.getElementsByTagName('html')[0].innerHTML;
        }); 
        console.log(html);
    } else {
        console.log('Page could not be loaded');
    }
    phantom.exit();
});

コメント行で実行phantomjs script.js http://www.website.co.uk > website.htmlします (script.js と phantom.exe は現在の作業ディレクトリにある必要があります)。http://www.website.co.ukダウンロードする必要があるWebサイトに変更し、website.html保存先の`htmlファイルに変更します。

于 2012-07-05T09:50:51.390 に答える