hexdump - hexdumpの混乱

Question

Unixのhexdumpユーティリティで遊んでいます。私の入力ファイルはUTF-8でエンコードされており、16進数のUTF-8である1文字が含まñれC3 B1ています。

hexdump test.txt
0000000 b1c3
0000002

は？これはB1 C3、私が期待したものの逆を示しています！誰かが説明できますか？

期待される出力を得るために私はします：

hexdump -C test.txt
00000000  c3 b1                                             |..|
00000002

エンコーディングシステムを理解していると思っていました。

score 52 · Accepted Answer

これは、hexdumpがデフォルトで16ビットワードを使用し、リトルエンディアンアーキテクチャで実行しているためです。したがって、バイトシーケンスb1 c3は16進ワードとして解釈されc3b1ます。この-Cオプションは、hexdumpがワードではなくバイトで動作するように強制します。

score 3 · Accepted Answer

私はそれを回避する2つの方法を見つけました：

hexdump -C file

また

od -tx1 < file

hexdumpがファイルは通常16ビットワードのリトルエンディアンであると判断したのはばかげていると思います。非常に紛らわしいIMO。

2 に答える 2