1

非改行スペースを含む Html Agility Pack を使用して、c# で html テーブルを解析しています。

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(page);

ページは、 テキスト内に特殊文字を含むテーブルを含む文字列です。

<td>&#160;test</td>
<td>number =&#160;123&#160;</td>

を使用SelectSingleNode(".//td").InnerTextすると、この特殊文字が含まれますが、無視したいです。

ソーステーブルを変更せずに (Html Agility Pack の助けを借りて、または使わずに) これを無視するエレガントな方法はありますか?

4

2 に答える 2

3

HtmlDecodeを使用できます

string foo = HttpUtility.HtmlDecode("Special char: &#160;");

あなたに文字列を与えるでしょう:

特殊文字:

于 2013-08-14T09:21:50.493 に答える