2

jsdom (node.js モジュール) を Windows で動作させようとしています。自分のノード バージョン用にビルドされていないと不平を言い続けます。

Linuxマシンにノード(ソースから同じバージョン、0.5.9)をインストールし、それをノードワフしました。次に、それをWindowsマシンにコピーしました(node_modulesの下)

それでもいけない...

何か案は?ノードからのリクエストへの応答から取得した HTML を解析するためのその他の推奨事項はありますか?

jsdom を介して jquery を使用するのは楽だったでしょう。

乾杯。

4

4 に答える 4

2

申し訳ありませんが、jsdom(> = 0.2.3)には現在、Windowsではうまく機能しないc++アドオンが必要です。最善の策は、jsdom @ 0.2.1をインストールして、jsdomのウィンドウのコンテキストでjavascriptを実行することによって引き起こされるメモリリークを回避することだと思います。

回避策は次のとおりです。

  • domごとに新しいプロセスを生成します
  • ウィンドウを再利用し、次の方法でDOMを置き換えます。document.body.innerHTML = '..new markup..';

意図はc++アドオンから離れることですが、残念ながら現時点ではそれは不可能です。

于 2011-10-24T23:10:17.457 に答える
1

node.js が絶対に必要というわけではない場合は、仲間の SO-ist @nrabinowitz によるpjscrapeをチェックしてください。それはテストされ、証明されています。

また、node-scraperは、222 個のウォッチャーと 11 個のフォークを備えた、あなたの仕事に適したツールのようです。これもかなりアクティブなようです。ユースケースは、readmeまたはSO のここにあります。

于 2011-10-18T14:02:22.690 に答える
0

あなたが何をしようとしているのか正確にはわかりませんが、node.ioには、法案に適合する可能性のあるスクレイピングフレームワークがあります.

于 2011-10-18T13:52:13.943 に答える