1

私は C# で Web サイトを読んでいて、コンテンツを文字列として取得しています。適切な形式の html 構造を持たないサイトがいくつかあります。

私は他のいくつかを試しHtmlAgilityPackましたが、私の場合は不可能な整形式のhtmlが必要です。

今、私はそれを Div またはスパン ID/クラスで読み取るための非常に簡単な方法が必要です。

これが私のhtml http://jsfiddle.net/bwJU7/です

簡単な C# コードを教えてください。

div class="item " 

、、、および私titleのhtmlで取得します。pricephotosdescription

4

1 に答える 1

0

コンテンツを文字列としてロードし、そこから通常の構造を期待しない場合は、正規表現が役に立ちます。

このようなものがあなたを助けるかもしれません:

String content = "Your content goes here";

var regex = new Regex("<div(?:.*?)class=\"item\"[^>]*>(.*?)</div>");
foreach (Match div in regex.Matches(content))
{               
    Console.WriteLine(div.Groups[0].Value);
}
于 2013-06-19T12:05:09.383 に答える