javascript を使用していくつかの Web ページをプレーンな html に変換したいのですが、いくつかの方法が見つかりました (間違っている場合は教えてください)。
- 例として、Jython を使用してください: http://blog.databigbang.com/web-scraping-ajax-and-javascript-sites/
- htmlunit と一緒に Java を使用する
- プロキシを使用します。例: http://grep.codeconsult.ch/2007/02/24/crowbar-scrape-javascript-generated-pages-via-gecko-and-rest/
- python を qt または PyV8 と一緒に使用する
要望に応えて小さなツールを作りたいので、V8とqtをインストールするのは少し複雑だと思ったので、pythonが第一候補でした。
そこで、gecko でプロキシを作成しようとしましたが、リモートの Linux サーバーでは余裕がない DISPLAY が必要なようです。
現在、jython を使用しようとしていますが、ページ全体を単純な html に変換する簡単な方法はないようです。
実際、ブラウザーと同じように、javascript を含む Web ページをプレーンな html に変換する方法はありますか。node.jsはこの仕事をすることができますか?