hive - 分割された寄木細工のファイルを Spark に読み込むと、フィールドの順序が正しくありません

翻译自：https://stackoverflow.com/questions/28734973 2015-02-26T05:18:36.957

618 次

テーブルの場合

create table mytable (

  ..
) 
    partitioned by (my_part_column String)

次のようにハイブSQLを実行しています。

   from pyspark.sql import HiveContext
   hc = HiveContext(sc)
   data = hc.sql("select * from my_table limit 10")

読み戻された値は、最後の項目ではなく、各行の最初の項目として「my_part_columns」を示しています。

1 に答える 1