google chrome などのブラウザで、ページの情報を取得したいときは、ページのソースを表示を選択するだけですが、javascript を使用する一部のサイトではそれができないため、ボタンなどの任意の要素でそれを発見し、検査を選択します必要な情報が表示されます。これは非常に優れていますが、たとえば html を使用する単純なページの場合は、これを自動的に実行したいと考えています。wget を使用してページをテキストに保存し、後で分析しますが、 javascript と css を使用するのは不可能なので、必要な情報を取得してテキストに保存するためのツールまたは方法はありますか? サイトと要素 (ボタン) を指定すると、コードがダウンロードされて保存されます。テキストへ
1 に答える
クロムを使用している場合はCtrl + Shift + J
、開発者ツール ウィンドウを開くことができます。左上のアイコン (Elements) をクリックして、JavaScript の変更後の DOM を確認します。
IE(7以降だと思います)ではF12
、同様のウィンドウを開くために使用します。
Ctrl + Shift +I
また、FireFox では、同様のウィンドウを開くために使用できます。
そして、このプロセスを自動化するには、http://www.phantomjs.org/を使用してみてください(ここで提案されているように: wget + JavaScript? )
編集:
IE には、現在の DOM を保存する [保存] ボタンがあります。
FireFox では、Ctrl + Shift + I
プレスCtrl + S
を押した後、現在の DOM が保存されます。
編集2:
PhantomJS をダウンロードし、script.js
これを貼り付けという名前のファイルを作成します。
system = require('system');
var page = new WebPage();
page.open(system.args[1], function (status) {
if(status == 'success') {
html = page.evaluate(function() {
return document.getElementsByTagName('html')[0].innerHTML;
});
console.log(html);
} else {
console.log('Page could not be loaded');
}
phantom.exit();
});
コメント行で実行phantomjs script.js http://www.website.co.uk > website.html
します (script.js と phantom.exe は現在の作業ディレクトリにある必要があります)。http://www.website.co.uk
ダウンロードする必要があるWebサイトに変更し、website.html
保存先の`htmlファイルに変更します。