c# - .net で Web ページのビューソースを動的に更新する方法

Question

「www.localbanya.com」という名前の Web サイトが 1 つあります。そのサイトから HTML 情報を取得したかったのですが、製品がリストされており、表示の構造は次のとおりです。

これは JavaScript に基づいて発生しているため、WebClient を使用してページソース全体を取得できません。

.net で WebClient クラスを使用してページ全体の情報を取得するときにページソースを更新する方法、またはページ全体の HTML 情報を一度に取得するために使用できるその他の方法があることを知りたいと思いました。

localbanyaの商品ページはこちらを参考にしてください

どんな助けでも大歓迎です。

score 0 · Accepted Answer

WebClient は明らかに JavaScript を実行しません。

そのためには、ある種のヘッドレスブラウザが必要になります。

C# や .NET の実装については知りませんが、多くのオプションがあります。

Phantom JSや、通常のブラウザーの動作を再現する他のヘッドレスブラウザーを調べて、そのためのスクリプトを作成することができます。

また、 Fiddlerなどを実行して、下にスクロールしたときにページからどのような要求が行われたかを確認し、データの取得方法をリバースエンジニアリングし、可能でWebClientあればそれを複製することもできます。

お役に立てれば。

1 に答える 1