これがばかげた質問であることはわかっていますが、何時間もグーグルで検索しても答えが得られません。
区切り文字がどのように機能するかは、csv などのプレーン テキスト形式で簡単に理解できます。一方、ORC ではバイナリが HDFS に格納されているため、フィールドの区切り文字は何でしょうか? ORC には区切り文字がないと言われましたが、私はこのステートメントに非常に疑問を持っています。
行グループとして格納されている場合でも、各行グループの 1 つの列に対して、複数のデータ フィールドが存在する可能性があります。各フィールドは次のフィールドとどのように区別されますか? 各行は次の行からどのように区切られていますか? これを達成するための区切り文字はありますか?
コメントありがとうございます!