3

javascript を使用していくつかの Web ページをプレーンな html に変換したいのですが、いくつかの方法が見つかりました (間違っている場合は教えてください)。

  1. 例として、Jython を使用してください: http://blog.databigbang.com/web-scraping-ajax-and-javascript-sites/
  2. htmlunit と一緒に Java を使用する
  3. プロキシを使用します。例: http://grep.codeconsult.ch/2007/02/24/crowbar-scrape-javascript-generated-pages-via-gecko-and-rest/
  4. python を qt または PyV8 と一緒に使用する

要望に応えて小さなツールを作りたいので、V8とqtをインストールするのは少し複雑だと思ったので、pythonが第一候補でした。

そこで、gecko でプロキシを作成しようとしましたが、リモートの Linux サーバーでは余裕がない DISPLAY が必要なようです。

現在、jython を使用しようとしていますが、ページ全体を単純な html に変換する簡単な方法はないようです。

実際、ブラウザーと同じように、javascript を含む Web ページをプレーンな html に変換する方法はありますか。node.jsはこの仕事をすることができますか?

4

1 に答える 1