hive - impala/hive/spark sql から「spark 登録済みテーブル」にアクセスできません

Question

scala を使用して spark でデータソースを作成します。ケースクラスがあり、RDD を作成してテーブルとして登録しました。スパークのドキュメントに示されている例と同じです。

val sqlContext = new org.apache.spark.sql.SQLContext(sc)
import sqlContext.createSchemaRDD
case class Person(name: String, age: Int)
val people = sc.textFile("examples/src/main/resources/people.txt").map(_.split(",")).map(p => Person(p(0), p(1).trim.toInt))
people.registerAsTable("people")
val teenagers = sqlContext.sql("SELECT name FROM people WHERE age >= 13 AND age <= 19")
teenagers.map(t => "Name: " + t(0)).collect().foreach(println)

ただし、Hive、impala、または spark-sql でテーブルにアクセスできません。「テーブルを表示」コマンドはテーブルを表示しません。これを達成する方法についてのアイデアはありますか？

ありがとうございました！

score 2 · Accepted Answer

ローカルに作成したテーブルとハイブメタストアの間に接続はありません。

ハイブを介してテーブルにアクセスするには、寄木細工のファイルを何らかの方法で生成し (コードは問題ありません)、それらをハイブメタストアに追加し ( をcreate table ...使用)、次にハイブ接続を介して使用するか、ハイブコンテキストを作成します ( org.apache.spark.sql.hive.HiveContext) 。

registerTempTableつまり、ローカルで使用されるメタデータ (で作成) と永続的なハイブメタデータ (メタストアに格納される)を区別する必要があります。

hive - impala/hive/spark sql から「spark 登録済みテーブル」にアクセスできません

1 に答える 1

Related

Reference