2

以下のコードを使用して、URL をダウンロードし、ファイルに保存して、そのファイルに html タグがあるかどうかを確認しようとしました (チェックしたいタグは check.json にあります)。これをコマンドラインから実行する必要があります。そのためには、javascript 言語の非同期コールバック機能が必要だと思います。

そして、私はこの時点で迷っています。私はそれを機能させることはできません。私の問題は、コマンドラインから、ファイルが存在しないというエラーが常に発生することです。

ダウンロードされるまで待ってからチェックを実行する必要があることはわかっています。しかし、コードを実行するたびに、その関数が呼び出されないようです。理由はわかりません。

したがって、私が理解する必要があるのは次のとおりです。

コマンドラインからこれを実行し、URL をダウンロードしてファイルに保存し、checks.json で確認して、結果をコンソールに出力する方法を教えてください。

ありがとうございました。

var fs = require('fs');
var program = require('commander'); 
var cheerio = require('cheerio');
var rest = require('restler');
var HTMLFILE_DEFAULT = "index.html";
var CHECKSFILE_DEFAULT = "checks.json";
var URLFILE_DEFAULT = "downloaded.html";


var assertFileExists = function(infile) {
    var instr = infile.toString();
    if(!fs.existsSync(instr)) {
        console.log("%s does not exist. Exiting.", instr);
        process.exit(1); // http://nodejs.org/api/process.html#process_process_exit_code
    }
    return instr;
};

var cheerioHtmlFile = function(htmlfile) {
    return cheerio.load(fs.readFileSync(htmlfile));
};

var loadChecks = function(checksfile) {
    return JSON.parse(fs.readFileSync(checksfile));
};

var checkHtmlFile = function(htmlfile, checksfile) {
    $ = cheerioHtmlFile(htmlfile);
    var checks = loadChecks(checksfile).sort();
    var out = {};
    for(var ii in checks) {
        var present = $(checks[ii]).length > 0;
        out[checks[ii]] = present;
    }
    return out;
};

var clone = function(fn) {
    // Workaround for commander.js issue.
    // http://stackoverflow.com/a/6772648
    return fn.bind({});
};

var downAnd2File = function() {
  rest.get('http://www.wired.com/').on('complete', function(result) {
  if (result instanceof Error) {
    sys.puts('Error: ' + result.message);
    this.retry(5000); // try again after 5 sec
  } else 

  {
    fs.writeFile(__dirname + '/downloaded.html', result, function(err) {
    if (err) throw err;
    console.log('Saved!');

});
  }
});
  downAnd2File(checkHtmlFile);
}

if(require.main == module) {
    program
        .option('-c, --checks <check_file>', 'Path to checks.json', clone(assertFileExists), CHECKSFILE_DEFAULT)
        .option('-f, --file <html_file>', 'Path to index.html', clone(assertFileExists), HTMLFILE_DEFAULT)
        .option('-u, --url  <html_file>', 'Path to downloaded url', clone(assertFileExists), URLFILE_DEFAULT) ///////////////
        .parse(process.argv); 
    var down2FileAndCheck = downAnd2File(checkHtmlFile(program.url, program.checks));
    var checkJson = checkHtmlFile(program.file, program.checks);
    var outJson = JSON.stringify(checkJson, null, 4);
    console.log(outJson);

} else {
    exports.checkHtmlFile = checkHtmlFile;
}
4

3 に答える 3

1

Mak が既に述べたように、取得したばかりの html をダウンロードして保存する必要はありません。

元のコードに対するマイナーなリファクタリングを次に示します。アイデアは、(URLまたは保存されたファイルから)htmlを取得することです。結果/データの準備ができたら、メソッドを呼び出してコンテンツのチェックを実行します。

function checkHtml(err, html){
    if (err){
        console.log('Error: ' + err);
        process.exit(1);
    }
    var checkJson = checkHtmlFile(html, program.checks);
    var outJson = JSON.stringify(checkJson, null, 4);
    console.log(outJson);
}

if(require.main == module){

    program
        .option('-c, --checks <check_file>', 'Check path', clone(assertFileExists), CHECKS_DEF)
        .option('-f, --file <html_file>', 'File path', clone(assertFileExists), HTML_DEF)
        .option('-u, --url <url_pointer>', 'Url link that needs to be graded')
        .parse(process.argv);

    if (program.url){
        rest.get(program.url)
            .on('complete', function(result){
                checkHtml((html instanceof Error), result);
            });

    } else {
        fs.readFile(program.file, checkHtml);
    }
}

お役に立てれば。

于 2013-07-10T04:02:13.510 に答える
0

JS コードが実行される前に問題が発生した場合に備えて:

ファイルを実行可能にしたい場合があります

  chmod +x <filename>

ファイルの上に次のステートメントを追加します。

  #!/usr/bin/env node

すでにそうなっていたらごめんなさい

于 2013-07-09T10:37:14.483 に答える