わかりましたので、楽しみのために、私の大学に通う、ウェブサイトのムードルにサインアップしているすべてのユーザーをスクレイピングすることにしました。
Node.jsとcheerioで作ったサイトをスクレイピングするプログラムですが、H2タグ内のテキストが取得できないようです。
http://moodle.ramapo.edu/user/profile.php?id=2101 必要なのは、ID 番号を変更するだけで、すべての学生をループします。
var request = require('request'),
cheerio = require('cheerio');
urls = [];
//For just single page, eventually will loop through each page.
request('http://moodle.ramapo.edu/user/profile.php?id=2101', function(err, resp, body){
if (!err && resp.statusCode == 200) {
var $ = cheerio.load(body);
$('h2.main', '#yui_3_9_1_2_1410303448188_167').each(function(){
//Not sure how to retrieve just the text name of person
});
console.log(urls);
};
});
H2 タグ内のテキストを選択して、それらすべてをコンソールに記録するにはどうすればよいですか?