c# - Webサイトにクエリを実行し、そこから公開データを取得します

Question

私はC＃プログラミングの初心者です。皆さんの助けをお願いします（可能であれば）。商品、価格、説明などのデータが掲載されたWebサイト（ショッピングWebサイト）があります。ウェブサイトには検索機能があるので、検索リンクをクエリしてデータを取得し、重要なデータ（製品ID、名前、価格、説明）のみを取得したいと思います。検索を実行すると多くのページが表示され、[次へ]を押すたびに、追加の製品リストを含む新しいページが表示されます。これらのタスクを簡単に自動化するにはどうすればよいですか？

インターネットでよく検索したところ、正規表現で使う必要があることがわかりwebclient()、ページの内容や検索結果のページをループする必要があるのではないかと思いました。みんなどう思いますか？

ウェブサイトの例。

あなたの側からの努力に感謝します。

score 0 · Accepted Answer

あなたが説明していることは、スクレイピングと呼ばれます。

必要なのは、HtmlAgilityPack などを使用して Web サイトを取得することです。次に、DOM を使用して、関心のあるノードを見つけ、その内部テキストを読み取ります。

全体のプロセスはかなり複雑ですが、少なくとも私はあなたを正しい方向に送り出しました. ほとんどの場合、検索 URL は同じ形式になる傾向があります。

たとえば、あなたのリンクで

http://cdon.se/hemelektronik/advanced-search?manufacturer-id=&title=.&title-matchtype=1&genre-id=&page-size=15&sort-order=142&page=2

「ページ」を他のものに変更すると、すべてのページをそのように移動できます。

追加: また、正規表現を使用して html を解析しようとしないでください。それはある特定の人を狂わせた...

正規表現は、XHTML 自己完結型タグを除く開始タグに一致します

c# - Webサイトにクエリを実行し、そこから公開データを取得します

1 に答える 1

Related

Reference