C# と Linq to XML を使用して RSS フィードを読み込もうとしています。フィードは utf-8 でエンコードされており ( http://pc03224.kr.hsnr.de/infosys/feed/を参照)、CDATA セクションで囲まれているため、説明ノードを除いて、通常は正常に読み取られます。
何らかの理由で、「description」タグの内容を読み取った後、デバッガーで CDATA タグが表示されませんが、このセクションでのみドイツ語のウムラウト (äöü) やその他の特殊文字が使用されていないため、どこかにあるに違いないと思います。正しく表示されます。代わりに、 のように utf-8 でエンコードされた文字列に残りますü
。
どうにかしてそれらを正しく読み取るか、少なくとも後でデコードできますか?
これは、問題を引き起こしている RSS セクションのサンプルです。
<description><![CDATA[blabla bietet Hörern meiner Vorlesungen “IAS”, “WEB” und “SWE” an, Lizenzen für blabla [...]]]></description>
RSS フィード データを読み取って解析するコードは次のとおりです。
RssItems = (from xElem in xml.Descendants("channel").Descendants("item")
select new RssItem
{
Content = xElem.Descendants("description").FirstOrDefault().Value,
...
}).ToList();
前もって感謝します!