0

私はC#プログラミングの初心者です。皆さんの助けをお願いします(可能であれば)。商品、価格、説明などのデータが掲載されたWebサイト(ショッピングWebサイト)があります。ウェブサイトには検索機能があるので、検索リンクをクエリしてデータを取得し、重要なデータ(製品ID、名前、価格、説明)のみを取得したいと思います。検索を実行すると多くのページが表示され、[次へ]を押すたびに、追加の製品リストを含む新しいページが表示されます。これらのタスクを簡単に自動化するにはどうすればよいですか?

インターネットでよく検索したところ、正規表現で使う必要があることがわかりwebclient()、ページの内容や検索結果のページをループする必要があるのではないかと思いました。みんなどう思いますか?

ウェブサイトの例。

あなたの側からの努力に感謝します。

4

1 に答える 1

0

あなたが説明していることは、スクレイピングと呼ばれます。

必要なのは、HtmlAgilityPack などを使用して Web サイトを取得することです。次に、DOM を使用して、関心のあるノードを見つけ、その内部テキストを読み取ります。

全体のプロセスはかなり複雑ですが、少なくとも私はあなたを正しい方向に送り出しました. ほとんどの場合、検索 URL は同じ形式になる傾向があります。

たとえば、あなたのリンクで

http://cdon.se/hemelektronik/advanced-search?manufacturer-id=&title=.&title-matchtype=1&genre-id=&page-size=15&sort-order=142&page=2

「ページ」を他のものに変更すると、すべてのページをそのように移動できます。

追加: また、正規表現を使用して html を解析しようとしないでください。それはある特定の人を狂わせた...

正規表現は、XHTML 自己完結型タグを除く開始タグに一致します

于 2012-07-22T12:09:35.587 に答える