属性のhtml値を変換するのに苦労してきましたが、成功しませんでした。
これが私が変換しようとしているHTMLです(文字セットがここに表示されないことを確認してください、しかし、私はあなたがそれを見るのとまったく同じようにそれを見る)。
<a href="https://sistemas.usp.br/jupiterweb/listarGradeCurricular?codcg=12&codcur=12012&codhab=1&tipo=N" target="_blank">Administração – São Paulo – diurno</a>
了解しました。このhtmlnodeの値は「Administração--SãoPaulo--diurno」です。
私はHtmlAgilityPackを使用してこれについてHtmlPageを解析しています。このノードに到達すると、そのinnerText値は次のようになります。Administração â São Paulo â diurno
ページの元の文字セットはUTF-8であると想定しています。これは、htmlのエンコーディングタグが私に言っていることだからです。
この奇妙な文字列を:に変換するにはどうすればよいAdministração - São Paulo - Diurno
ですか?
私はすでにこれらのスレッドを試しました:スレッド1とスレッド2 、そして何も私の問題を解決しませんでした
編集:C#WebRequestGetを介してページを取得しています。
EDIT2:HtmlAgilityPackタグを追加
問題は特定されました:WebRequestが時々Htmlを台無しにしています。
エンコーディングを設定する他の方法はありますか?私が試しているのは:_webReq.Encoding = "ISO-8859-1"
前もって感謝します