含まれているstring
HTML があり、Windows 8 ストア アプリ内で解析する必要があります。System.Windows.Forms.HtmlDocumentは、ストア アプリでは使用できません。ページ リンク、画像リンク、テキスト コンテンツを抽出するだけです。
迅速で汚い解決策として正規表現を使用できると思いますが、もっと良い方法があるはずです。構文解析は堅牢で、HTML がわずかに壊れていたり標準的でない場合でも、文字列全体を拒否しないようにする必要があります。グーグルはいくつかの代替手段を提供しますが、結果は決定的ではなく、実際にこれを行った人からの直接的な回答(または回答のリスト)が必要です. いくつかのコードはいいでしょう、または良いコードでSOの答えへのリンクだけです。
明確化のためのいくつかのコード:
public async void doSomeHtmlStuff(string url) {
System.Net.Http.HttpClient client = new HttpClient();
string html = await client.GetStringAsync(url);
// parse the html, how?
// NOT anything like this, document tree is needed for context
var links = Regex.Matches(html, "<a\\s*href=.*>.*</a>");
}