5

Dom を変更しないが、いくつかの数値を返す JS API がいくつかある Web ページがあります。そのようなページをダウンロードし、ダウンロードしたページのコンテキストでそれらの機能を実行する NodeJS アプリケーションを作成したいと思います。

ページスクレイピング用のcheerioを見ていました..しかし、それを使用してDOMをナビゲートして操作するのがいかに簡単かはわかりますが、ページ機能を実行するためのアクセスは見られません. それは可能ですか?

代わりに、jsdom を見る必要がありますか?

ありがとう

4

2 に答える 2

5

完全にレンダリングされた出力を提供する PhantomJS を使用してから、cheerio を使用したいようです。

于 2013-08-28T01:52:51.820 に答える
0

Cheerio と jsdom はどちらも HTML スクレイパーであり、JavaScript を実行するという概念はありません。アクセスしたい API が JavaScript で記述されている場合、それらを抽出してノード内で実行することを妨げるものはほとんどありません。ただし、任意の JavaScript をダウンロード/実行すると、大きなセキュリティ リスクが生じる可能性があることに注意してください。ブラウザの動作をシミュレートしたい場合は、http://phantomjs.org/を見てください。これは Node 用のヘッドレス ブラウザであり、通常のブラウザでできることはすべて実行できます。

于 2013-02-22T18:27:30.453 に答える