c# - テキストファイルのÂ¿は何ですか

Question

大量のテキストファイルを処理するC＃プログラムに取り組んでいます。これらのファイルはシステムによって作成されているため、ソースを変更することはできませんが、ファイル内に複数回表示されるため、コードがフォールオーバーします。

Â¿はどういう意味で、どうすれば処理できますか？

score 3 · Accepted Answer

Â¿は、別のエンコーディングタイプから変換され、エンコーディングタイプの文字テーブルで認識されない文字があることを意味します。別のエンコーディングタイプを使用する場合は、それを処理できます。

score 3 · Accepted Answer

Unicodeでエンコードされたファイルの先頭には、「ヘッダー」があります。このヘッダーは、それを読み取るプログラムに、それがUnicodeファイルであることを通知します。これは「バイト順マーク」と呼ばれ、それがどのタイプのUnicodeであるかを読者に示します。 http://msdn.microsoft.com/en-us/library/windows/desktop/dd374101(v=vs.85).aspx

score 0 · Accepted Answer

私のコメントを詳しく説明するために、最初にこれらが作成されたときに使用されたエンコーディングを確認し、次にそれらを読み込むときにそのエンコーディングを使用する必要があります。チェックアウト：

BinaryReader(Stream, Encoding)

http://msdn.microsoft.com/en-us/library/system.io.binaryreader.aspx

c# - テキストファイルのÂ¿は何ですか

3 に答える 3

Related

Reference