0

テキスト要素の一部を引き出して他の目的に再利用する必要があるXmlが大量に与えられました。(私はXDocumentを使用してXmlデータをプルしています)。

しかし、要素に含まれているテキストをデコードするにはどうすればよいですか?ここで使用されているフォーマットも何ですか?いくつかの例:

"What is the meaning of this® asks Sonny."
"The big centre cost 1¾ million pounds"
"... lost it. ® The next ..."

私は試しHttpUtility.HtmlDecodeましたが、それはうまくいきませんでした。「®」を2回デコードすると 明らかに正しくない®に変わります。

®のように見えます 改行です。® おそらく疑問符です。190のもの、私も知りません。おそらくドットまたはコンマ?

どんなアイデアでも大歓迎です。

4

1 に答える 1

0

表示されている文字列は、HTML でエンコードされてから、XML でエンコードされた (または HTML が再び) エンコードされているようです。

-> -> (登録商標記号) ISO Latin-1 エンティティごとに正しいのは同じように動作する必要があることです。®®®®

同様&amp#190;に、4 分の 3 を表す分数になります。

于 2012-04-06T10:20:39.297 に答える