3

e コマース Web サイトを新しいプラットフォームに移行しています。すべてのページが静的な html であり、データベースにすべての製品情報がないため、現在の Web サイトから製品の説明を取得する必要があります。

ここにページの 1 つがあります: http://www.cabinplace.com/accrugsbathblackbear.htm

説明を文字列に入れるのが最善でしたか? HTMLアジリティパックを使用する必要がありますか? もしそうなら、これはどのように行われますか?私はhtmlアジリティパックとxhtml全般に慣れていないので。

ありがとう

4

2 に答える 2

1

HTML Agility Pack は、この種の作業に使用するのに適したライブラリです。

すべてのコンテンツがこのように構成されているかどうか、または HTML ファイルから投稿したフラグメントの種類を既に取得しているかどうかを示していないため、これ以上アドバイスすることは困難です.

一般に、すべてのページが同様に構造化されている場合、XPath 式を使用して段落を抽出し、各ページからinnerHtmlorを選択します。innerText

次のようなもの:

var description = htmlDoc.SelectNodes("p[@class='content_txt']")[0].innerText;
于 2011-05-26T18:58:53.243 に答える