免責事項: 私はこれらのライブラリの開発者です
はい、HTML には「&#XXX;」などの Unicode 記号が含まれる場合があります。または「」。また、たとえば、HTML に 3 列 2 行の表がある場合、この結果を表形式のテキストとして表示するとよいでしょう。
1 2 3
4 5 6
「1 2 3 4 5 6」の代わりに。
これらの.Net ライブラリは、HTML および RTF を Text に変換するのに役立ちます。
サンプル #1 - HTML を Unicode テキストに変換します。
SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
h.OutputFormat=SautinSoft.HtmlToRtf.eOutputFormat.TextUnicode;
string text = h.ConvertString(htmlString);
サンプル #2 - RTF を Unicode テキストに変換します。
SautinSoft.RtfToHtml r = new SautinSoft.RtfToHtml();
r.OutputFormat = SautinSoft.RtfToHtml.eOutputFormat.Text;
string text = r.ConvertString(rtfString);