私はphantomjsでこれを行うことができました。
@Barmarが述べたように、動的に生成されたHTMLコンテンツをwgetまたはcurlで取得することはできません。これらは、jsをサポートしていないか、jsエンジンをサポートしていないためです。
一方、phantomjsはjsをサポートしており、ブラウザのように動作できます。リクエストを投稿したり、Cookieを保存したり、Javaでサポートされているブラウザで実行できるその他の多くのこともできます。
これは、[ページをホストし、ダイナミックHTMLコンテンツを取得し、Cookieを保存する]ジョブを実行するサンプルのjsスクリプトです。
var page = require('webpage').create(),
system = require('system');
if (system.args.length < 2 || system.args.length > 2) {
console.log('Usage: dl.js URL');
phantom.exit(1);
}
else{
var url=system.args[1];
page.open(url,
function (status) {
if (status !== 'success') {
console.log('Unable to access network');
} else {
window.setTimeout(function(){
steps = page.content;
console.log(steps);
phantom.exit();
},10000);
}
});
}
ありがとうございました。