http://www.codeproject.com/Articles/91894/HTML-as-a-Source-for-a-DOCX-Fileを使用して HTML を docx に変換しています。
ほとんどの文字は正しく読み取られますが、•、“ ” などの一部の特殊文字は と表示されます。これを修正するにはどうすればよいですか?
HTMLtoDocx に渡した HTML も、特殊文字を正しく読み取れませんでした。代わりに「?」と表示されていました。エンコーディングを Encoding.Default に変更すると、正しい文字が返されます。HTMLtoDOCX では、エンコーディングを設定できる場所が 2 つあります (下の行)。両方の場所で、エンコード形式を Encoding.UTF8 から Encoding に変更してみました。しかし、それは役に立ちません。
StreamWriter streamStartPart = new StreamWriter(docpartDocumentXML.GetStream(FileMode.Create, FileAccess.Write), Encoding.Default);
byte[] Origem = Encoding.Default.GetBytes(html);