私はこのようなTAGを持つxmlファイルを持っています:
<Question>dzia&#322;owa</Question>
XmlTextReaderを使用してこのファイルを読んでいますが、このTAGの場合は次のようになります。
działowa
xml内のhtmlエンティティ番号を置き換えて、「działowa」のようなものを取得するにはどうすればよいですか?
私はこのようなTAGを持つxmlファイルを持っています:
<Question>dzia&#322;owa</Question>
XmlTextReaderを使用してこのファイルを読んでいますが、このTAGの場合は次のようになります。
działowa
xml内のhtmlエンティティ番号を置き換えて、「działowa」のようなものを取得するにはどうすればよいですか?
サンプルの唯一のHTMLエンティティはです&
。次に、という通常のテキストが表示されます#322;
。あなたはどちらかが欲しい
<Question>dzia&łowa</Question>
これは「dzia&łowa」を与えるでしょう(おそらくあなたが望むものではありません)
また
<Question>działowa</Question>
これは「działowa」を与えるでしょう
問題の一部を解決したと思います(&#number;をcharにエンコード):
public static string EntityNumbersToEntityValues(string s)
{
Match match = Regex.Match(s, @"&#(\d+);", RegexOptions.IgnoreCase);
while(match.Success)
{
string v = match.Groups[1].Value;
string c = char.ConvertFromUtf32(int.Parse(v));
s = Regex.Replace(s, string.Format("&#{0};", v), c);
match = match.NextMatch();
}
return s;
}