私はNode.jsに比較的慣れていないので、簡単なモジュールを作成して、Node.jsに慣れようとしています。このモジュールの目的は、IDを取得し、Webサイトをスクレイプし、データを含む一連の辞書を返すことです。
Webサイトのデータはページ全体に散在していますが、すべてのページはURIの異なるインデックス番号でアクセスされます。とを取得し、これを介してWebサイトをid
スクレイプする関数を定義しました。イベントが発生すると、データは、構造化された方法でデータを取得するために正規表現を適用する別の関数に渡されます。page_number
http.request()
page_number
end
モジュールが完全な機能を持つためにpage_nums
は、Webサイトで利用可能なすべてのものをスクレイプする必要があります。
Node.jsスタイル/哲学では、すべてのページのスクレイピング関数を呼び出し、すべての戻りの結果を集約して、エクスポートされた関数からそれらをすべて一度に返す標準のfor()ループを作成しても大丈夫ですか?
編集
freenodeの#node.jsの助けを借りて解決策を見つけました。動作するコードはhttp://github.com/attheodo/katina_nodeにあります。
コメントありがとうございます。