2

これは重複した質問である可能性がありますが、どの検索用語を検索するかわからないので、以前に質問されたことがあれば、私を苦しめないでください(そしてそれは確かにそうだったと思います)。

そのため、クラスを使用してWebページのソースコードを取得し、WebClient文字列全体をsource変数に保存しています。

var client = new WebClient();
client.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
var data = client.OpenRead(urlAddress);
var reader = new StreamReader(data);
var source = reader.ReadToEnd();
data.Close();
reader.Close();

sourceここで、変数からの特定のテキスト範囲、特にユーザーが投稿したメッセージを処理したいと思います。ここで問題となるのは、Webページのソース "&"が実際には&、 "'"であり’、引用符( ")が、、–であり“”誰が他に何を知っているかということです。

文字列方式を使用してこれらのコードを実際のシンボルに置き換えることはできますが、Replaceこれらすべてのコードを実際の(予想される)シンボルに変換する方法があるかどうかを知りたいと思います。それを実行できるメソッドはありますか、それともインターネット上のライブラリやユーティリティクラスはありますか?

4

1 に答える 1

4

HttpUtility.HtmlDecodeまたはを使用してみてくださいHttpServerUtility.HtmlDecode

于 2012-09-11T16:45:29.287 に答える