以下のコードを使用して、URL をダウンロードし、ファイルに保存して、そのファイルに html タグがあるかどうかを確認しようとしました (チェックしたいタグは check.json にあります)。これをコマンドラインから実行する必要があります。そのためには、javascript 言語の非同期コールバック機能が必要だと思います。
そして、私はこの時点で迷っています。私はそれを機能させることはできません。私の問題は、コマンドラインから、ファイルが存在しないというエラーが常に発生することです。
ダウンロードされるまで待ってからチェックを実行する必要があることはわかっています。しかし、コードを実行するたびに、その関数が呼び出されないようです。理由はわかりません。
したがって、私が理解する必要があるのは次のとおりです。
コマンドラインからこれを実行し、URL をダウンロードしてファイルに保存し、checks.json で確認して、結果をコンソールに出力する方法を教えてください。
ありがとうございました。
var fs = require('fs');
var program = require('commander');
var cheerio = require('cheerio');
var rest = require('restler');
var HTMLFILE_DEFAULT = "index.html";
var CHECKSFILE_DEFAULT = "checks.json";
var URLFILE_DEFAULT = "downloaded.html";
var assertFileExists = function(infile) {
var instr = infile.toString();
if(!fs.existsSync(instr)) {
console.log("%s does not exist. Exiting.", instr);
process.exit(1); // http://nodejs.org/api/process.html#process_process_exit_code
}
return instr;
};
var cheerioHtmlFile = function(htmlfile) {
return cheerio.load(fs.readFileSync(htmlfile));
};
var loadChecks = function(checksfile) {
return JSON.parse(fs.readFileSync(checksfile));
};
var checkHtmlFile = function(htmlfile, checksfile) {
$ = cheerioHtmlFile(htmlfile);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
return out;
};
var clone = function(fn) {
// Workaround for commander.js issue.
// http://stackoverflow.com/a/6772648
return fn.bind({});
};
var downAnd2File = function() {
rest.get('http://www.wired.com/').on('complete', function(result) {
if (result instanceof Error) {
sys.puts('Error: ' + result.message);
this.retry(5000); // try again after 5 sec
} else
{
fs.writeFile(__dirname + '/downloaded.html', result, function(err) {
if (err) throw err;
console.log('Saved!');
});
}
});
downAnd2File(checkHtmlFile);
}
if(require.main == module) {
program
.option('-c, --checks <check_file>', 'Path to checks.json', clone(assertFileExists), CHECKSFILE_DEFAULT)
.option('-f, --file <html_file>', 'Path to index.html', clone(assertFileExists), HTMLFILE_DEFAULT)
.option('-u, --url <html_file>', 'Path to downloaded url', clone(assertFileExists), URLFILE_DEFAULT) ///////////////
.parse(process.argv);
var down2FileAndCheck = downAnd2File(checkHtmlFile(program.url, program.checks));
var checkJson = checkHtmlFile(program.file, program.checks);
var outJson = JSON.stringify(checkJson, null, 4);
console.log(outJson);
} else {
exports.checkHtmlFile = checkHtmlFile;
}