[phantomjs -v 1.9.7] NightmareJS: https://github.com/segmentio/nightmare
タイムアウト オプションを使用する 1 つのサンプルでわかるように、オプションを最適に設定しました。
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
も試した
new Nightmare({ignoreSslErrors : true, sslProtocol : 'tlsv1'})
httpsページが開きません。
phantomjs を直接使用して同じページにアクセスすると、正常に動作します。
phantomjs --ignore-ssl-errors=true --ssl-protocol=tlsv1 testBot.js
ページのタイトルはログインです
*** testBot.js
var page = require('webpage').create();
var url = 'https://www.some-https-site/login/';
page.onConsoleMessage = function(msg) {
console.log('Page title is ' + msg);
};
page.open(url, function(status) {
page.evaluate(function() {
console.log(document.title);
});
phantom.exit();
});
このコードは非常に厄介ですが、サイトを HTTPS ではなく HTTP に戻すと完全に機能します。
// Main nightmare call
// Code is quite messy, i know.
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.useragent('chrome')
.use(openpage())
.evaluate(function() {
return document.title;
},function(title) {
// console.info('FALSE = not logged in');
console.info('title : ' + title);
if (title === 'Login'){
console.info('false');
loginCheckBit = false;
}else if (title === 'Print Invoice'){
loginCheckBit = true;
console.info('true');
}else{
console.info('#########################################');
console.info(' NEED TO TROUBLESHOOT scraper looks lost');
console.info('#########################################');
}
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
if (!loginCheckBit){
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(login(user))
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('#################');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}else{
new Nightmare({ignoreSslErrors : 'true', sslProtocol : 'tlsv1'})
.use(openpage())
.use(screenshot())
.evaluate(function() {
return document.title;
},function(title) {
console.info('################');
console.info('inside 2nd eval');
console.info('title : ' + title);
makePDF();
})
.run(function(err, nightmare){
if (err){
console.info('err : ' + err);
}
});
}
});
function openpage(user){
console.info('============ BOT URL CALL =============');
console.info(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/');
console.info('====================================');
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.wait();
};
}
function login(user){
return function(nightmare){
nightmare
.goto(rootURL + '/account/invoices/'+req.params.id+'/printerFriendly/')
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
.click('.btn-login')
.wait();
};
}
「ログイン」機能を呼び出したときに HTTPS が失敗し、入力ボックスが見つからないことはわかっています。
.type("input[name='username']", user.name)
.type("input[name='password']", user.pass)
Nightmare は入力ボックスに対してエラーを返し、ページのタイトルは null です。「ボット」がログインしているかどうかに応じて、「ログイン」または「請求書の印刷」のいずれかになります。
次のスレッドは、「tlsv1」に関して私を正しい方向に導きました: PhantomJS は HTTPS サイトを開くことができませんでしたが、ナイトメア内で動作させることができません。