PhantomJS を使用してページをロードし (Javascript を使用して Web ページに項目をロードする)、ページ上のすべての HTML (少なくとも<body />
タグ内) を実行する PHP 関数に返そうとしていますphantomjs httpget.js
。
問題: phantomjs を取得して を返すことはできますが、 simple にdocument.title
依頼すると. が返されます。ページの HTML を抽出するにはどうすればよいですか?console.log(document.body)
[object Object]
また、phantomjs を使用して Web ページを読み込むには、ブラウザに比べてはるかに時間がかかります。
httpget.js
console.log('hello!');
var page = require('webpage').create();
page.open("http://www.asos.com/Men/T-Shirts-Vests/Cat/pgecategory.aspx?cid=7616#parentID=-1&pge=0&pgeSize=900&sort=1",
function(status){
console.log('Page title is ' + page.evaluate(function () {
return document.body;
}));
phantom.exit();
});
出力 (シェルから実行)
hello!
Page title is [object Object]