Hadoop ストリーミングのテキスト レコードが改行文字で区切られていること、およびキーと値の間に設定可能な区切り文字があることを理解しています (デフォルトはタブ)。
1) rawbytes 形式の構造は、レコードまたはキー/値の区切り記号が不要であることを示唆していますが、誰かがこれが事実であることを確認できますか?
2) typedbytes 形式では、キーと値はどのように区切られ、レコードはどのように区切られますか?
3) また、キーは typedbytes と rawbytes 形式でどのようにソートされますか?