2

次のようなことを行う単純なWebスクレイパーを作成しようとしています。

  1. yellowpages.comにアクセスします
  2. まだスクレイプしていない最初のカテゴリを選択します
  3. まだ削っていない最初のビジネスをクリックします
  4. ビジネスのタイトル、電話番号、説明をスクレイプします
  5. 取得したデータを.csvファイル(またはデータベース)に追加します
  6. 手順1に戻ります

Node.js / jQueryは、このようなことを実現するのに最も簡単だと思いました。誰かが私にチュートリアルを教えたり、何かをすばやくまとめたりすることはできますか?

4

1 に答える 1

4

NodeJS と Chimera を使用したスクレイピングに関する昨日の Hacker News の記事を読んでください。同じ著者が、 NodeJS を使用した強化された Web スクレイピングに関する以前の記事を書きました。

Chimera は、ヘッドレス Web ブラウザー (QtWebkit) を使用しているため、クールに見えます。そのため、JS を使用してロードするページを取得できます。これは、私が仕事で構築しているスクレーパーに必要です。

于 2013-01-03T15:59:18.513 に答える