C#:ウェブページのソースコードからの文字列があります:
<script type="text/javascript">
var itemsLocalDeals = [{"category":"HEALTHCARE SERVICES",
"dealPermaLink":"/deals/aachen/NLP-Deutschlandde
5510969","dealPrice":"399,00 \u20ac",..........
その文字列を使用して、 dealPriceを抽出し、それをList <>に追加するなどの操作を行います(文字列全体で複数のdealPriceがあります)。
すべての「 \u20ac」を実際の文字(「€」)にデコードする方法はありますか?他の文字もあるので、€-文字だけでなくデコードする必要があります。
コードをデバッグしてローカルフィールド/変数を確認すると、文字列には「€」文字ではなく、エスケープされたシーケンス「\\u20ac」が含まれています。
myString.DecodeUnicodeToRealCharactersのようなもの。
結果を(UTF-8)result.txtに書き込んでいます
どうもありがとう!
PS:残念ながら.Net2.0のみ...