apache-spark - Hive orc テーブルの spark beeline からのデータを表示できません

Question

以下のように orc ハイブテーブルを作成しました。

orc TBLPROPERTIES ('transactional'='true') として格納された 2 つのバケットに (id) によってクラスター化されたテーブル forest41 (id int、type string) を作成します。

テーブル forest41 値 (1,'赤'),(2,'白'),(3,'黒') に挿入します。

Spark beeline からのデータを表示しようとすると、データが表示されず、例外もスローされません。

以下は私が実行したクエリです: select * from default.forest40 limit 10

ただし、spark ジョブコンソールでは、上記のクエリに関連するジョブの 1 つが表示されます - Skipped Stages (1) -- Spark JDBC Server Query

score 1 · Accepted Answer

Hive のバケット機能を使用して Hive テーブルを作成しましたが、Spark はサポートしていません。

1 に答える 1