大量のテキストファイルを処理するC#プログラムに取り組んでいます。これらのファイルはシステムによって作成されているため、ソースを変更することはできませんが、ファイル内に複数回表示されるため、コードがフォールオーバーします。
¿はどういう意味で、どうすれば処理できますか?
¿は、別のエンコーディングタイプから変換され、エンコーディングタイプの文字テーブルで認識されない文字があることを意味します。別のエンコーディングタイプを使用する場合は、それを処理できます。
Unicodeでエンコードされたファイルの先頭には、「ヘッダー」があります。このヘッダーは、それを読み取るプログラムに、それがUnicodeファイルであることを通知します。これは「バイト順マーク」と呼ばれ、それがどのタイプのUnicodeであるかを読者に示します。 http://msdn.microsoft.com/en-us/library/windows/desktop/dd374101(v=vs.85).aspx
私のコメントを詳しく説明するために、最初にこれらが作成されたときに使用されたエンコーディングを確認し、次にそれらを読み込むときにそのエンコーディングを使用する必要があります。チェックアウト:
BinaryReader(Stream, Encoding)
http://msdn.microsoft.com/en-us/library/system.io.binaryreader.aspx