テーブルの場合
create table mytable (
..
)
partitioned by (my_part_column String)
次のようにハイブSQLを実行しています。
from pyspark.sql import HiveContext
hc = HiveContext(sc)
data = hc.sql("select * from my_table limit 10")
読み戻された値は、最後の項目ではなく、各行の最初の項目として「my_part_columns」を示しています。