関数を使用してページの情報をスクレイピングしようとしていjsdom.env
ます。ただし、env()
コールバックで返されるページは、ブラウザで同じ URL を読み込んだときに表示されることを望んでいるコンテンツではなく、サーバーへのアクセスが拒否された方法に関するものです。
したがって、ブラウザーがページをロードする方法と jsdom がページをロードする方法に違いがあるようです。jsdom
これはモジュールで構成できるものですか?
編集:
URL の例:http://www.bestbuy.com/site/HP+-+20%22+Widescreen+Flat-Panel+LCD+Monitor/1422209.p?id=1218257754431&skuId=1422209
アップデート:
問題は、user-agent http ヘッダーを指定していない jsdom でした。以下の詳細な回答を見てください