MS Word オートメーションを使用して、.doc を .htm に保存しました。.doc ファイルに箇条書き文字がある場合、それらは .htm に正常に保存されますが、.htm ファイルを文字列に読み込もうとすると (そのため、後で最終的に格納するためにデータベースに送信して、文字列ではなく文字列として保存できます)。ブロブ)、箇条書きは、文字列への読み込みに使用されるエンコーディングに応じて、疑問符またはその他の文字に変換されます。
私はこれを使ってテキストを読んでいます:
string html = File.ReadAllText(myFileSpec);
StreamReader も使用してみましたが、同じ結果が得られました (File.ReadAllText によって内部的に使用されている可能性があります)。
また、File.ReadAllText の 2 番目のオーバーロードですべての種類のエンコーディングを指定しようとしました。
string html = File.ReadAllText(originalFile, Encoding.ASCII);
Encoding タイプで使用可能なすべての列挙型を試しました。
何か案は?