問題タブ [hivecontext]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - スパークとスカラの問題でデータフレームを比較して増分データをインポートする
を使用してOracleからデータフレームを派生Sqlcontext
させ、一時テーブルとして登録しましたtb1
。
Hive using から派生した別のデータフレームがあり、HiveContext
これを table として登録しましたtb2
。
を使用してこれら 2 つのテーブルにアクセスしようとすると、次HiveContext
のようなエラーが発生しますUnable to find tb1 and when try it with sqlcontext
。
のようなエラーが発生していますUnable to find tb2
。
これについて何か助けてください。
もちろんScalaでやっています。
apache-spark - count(distinct) が Spark 1.6 の hivecontext クエリで機能しない
最近、バージョン 1.3 から 1.6 へのスパーク アップデートが行われました。このアップデートの後、"having count(distinct)" 条件を含むクエリが機能しなくなり、以下のエラーが発生します。
クエリ ::
「count(*) を持つクエリは正常に機能しています」
例:
これに対する解決策があればお知らせください。どうもありがとうございました
エラー::
apache-spark - java.lang.NoSuchMethodError: org.apache.spark.sql.hive.HiveContext.sql(Ljava/lang/String;)Lorg/Apache/spark/sql/DataFrame
spark-submit を使用して spark プログラムを実行しているときに、以下のエラーが発生します。
私の spark-cluster はバージョン 2.0.0 で、sbt を使用してコードをコンパイルしています。以下は私の sbt 依存関係です。
sql - SparkJob ファイル名
私は次のようなものを含むHQLクエリを使用しています...
ハイブに入り、そのコマンドを使用すると、正常に機能します。
それをpyspark、hivecontextコマンドに入れると、代わりにエラーが発生します...
なぜこれが考えられるのでしょうか?
apache-spark - sparkcontext または hivecontext (コマンド ラインではなく) を介してコードを介してファイルからハイブ クエリを実行する
ファイルにハイブクエリがほとんどないことを考慮してください。私のモットーは、hivecontext
またはを使用してファイルを実行することですsparkcontext
コマンドラインを使用してそれを行うことができますが、hive -f 'filepath/filename'
コードを介して実行する必要があります(hivecontext
またはsparkcontext
)誰かこれについて助けてもらえますか?
単一のクエリの場合、次を使用できます。
しかし、クエリを持つファイルを実行する必要があります。
apache-spark-sql - Spark SQL を使用した OLAP 関数の実行
私はsparkバージョン1.6で作業しています。Spark で SQL クエリを使用して、CUBE、ROLLUP、GROUPING SETS などの OLAP 関数を実行したいと考えています。キューブ関数とロールアップ関数がデータフレーム API で使用できることは理解していますが、SQL クエリを介してそれらを実行するにはどうすればよいですか?
これには HiveContext を使用する必要がありますか? そのために Hive をセットアップする必要がありますか? HiveContext を使用して実行される SQL クエリによってアクセスできるテーブルとしてデータフレームを永続化するにはどうすればよいですか?
サンプルコードを見ていただければ幸いです。ありがとう。
dataframe - パッケージ ハイブ内のオブジェクト HiveContext にパッケージ内でアクセスできません
HI Coders、また戻ってきました。scala コードで HIve コンテキストを使用してデータフレームからハイブ テーブルを作成しようとしていますが、sqlContext で作成できますが、HiveContext に関してはこのエラーがスローされます。
少し異なる宣言でも同じことを試しましたが、
sbt ライブラリの依存関係も追加しました。
libraryDependencies += "org.apache.spark" % "spark-hive_2.10" % "1.6.1"
私も「provided」で試しました。
ここに私のコードがあります
これに関する修正はありますか?この「アクセスできません」というエラーに遭遇したことはありません。
また、コードからtemptableを作成しようとしました
しかし、mdl_events テーブルはどこにありますか? これを探すことができるスパークのデフォルトデータベースはありますか? 私はスパークシェルが好きではありません。