Web ページの htmldump を取得しています。しかし、実行時に Javascript によってロードされるコンテンツを取得できません。
ブラウザの動作を模倣し、ブラウザに表示されるものとまったく同じhtmldumpを抽出する最良の方法は何ですか.
私たちはJavaを使用しており、人々は以前にセレンを使用していましたが、速度の問題があるようです.
Web ページの htmldump を取得しています。しかし、実行時に Javascript によってロードされるコンテンツを取得できません。
ブラウザの動作を模倣し、ブラウザに表示されるものとまったく同じhtmldumpを抽出する最良の方法は何ですか.
私たちはJavaを使用しており、人々は以前にセレンを使用していましたが、速度の問題があるようです.
FirefoxまたはChromeを使用することに満足している場合、Seleniumはかなり高速になります。Seleniumをヘッドレスで実行する方法もあります(私が実行したわけではありません)。これにより、十分に高速なソリューションを提供することもできます。それ以外の場合は、 Seleniumsのパフォーマンス速度の向上に取り組む投稿やブログ(例)があります。もう1つのオプションは、WatiNを調べることですが、これはWebBrowserのセスフラワーの提案と同じように.Netにもあります。
HtmlUnitを試すことができます。これはjavascriptをサポートするヘッドレスブラウザなので、やりたいことができるはずです。
.Net を使用している場合は、WebBrowserコントロールを利用できます。
MSDNによると:
ユーザーがフォーム内の Web ページをナビゲートできるようにします。
プログラムで制御できます。