残念ながら、ファイルがどのように生成されたかについての情報を取得できないファイルを受け取りました。これらのファイルを解析する必要があります。
ファイルは、1文字を除いて完全にASCIIです:0xDB(10進数で219になります)。
明らかに(ファイルを見ると)この文字は通貨記号です。私はそれを知っています:
- これらのファイルには、金額が表示される場所に通貨記号を含める必要があります
- ファイルのどこにも他の通貨記号($でもユーロでも何もない)もありません
- その0xDBが表示されるたびに、金額の横になります
これらのファイルでは、0xDBがユーロ記号を表すことになっていると思います(実際には、この0xDBがユーロ記号が表示されるはずのすべての場所に表示される可能性が非常に高くなります)。
fileコマンドは、ファイルについて次のように記述します。
ISO-8859 English text, with CRLF, LF line terminators
hexdumpはこれを与えます:
00000030 71 75 61 6e 74 20 db 32 2e 36 30 0a 20 41 49 4d |quant .2.60. AIM|
^^ ^
それ以外の場合、ファイルはすべて通常どおりフォーマット/解析可能です。実際、私はその奇妙な0xDB文字以外のすべての情報をうまく取得しています。
誰かが何が起こっているのか知っていますか?通貨記号(おそらくユーロ記号)はどのようにして0xDBになりましたか?
ISO-8859-1(別名ISO Latin 1)でもISO-8859-15でもありません。どちらの場合も、コードポイント219は「Û」に対応するためです(Unicodeコードポイント219が「LATINCAPITAL LETTER U WITH CIRCUMFLEX」であるのと同じです)。
拡張ASCIIではありません。