問題タブ [hivecontext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
596 参照

sparkr - HiveContext を使用して、Spark で最小値を含む行を除く行を選択します

タイムスタンプとマシン ID を含む Spark データ フレームがあります。各グループから最も低いタイムスタンプ値を削除したいと考えています。次のコードを試しました:

しかし、次のエラーが発生しています。

何が問題ですか?HiveContext が EXCEPT キーワードをサポートしていない場合、HiveContext で同じことを行う同義の方法は何ですか?

0 投票する
1 に答える
1368 参照

python - Python でプログラムによって HiveThriftServer を起動する

spark-shell (scala) では、org.apache.spark.sql.hive.thriftserver._ をインポートして、HiveThriftServer2.startWithContext(hiveContext) として特定のハイブ コンテキストに対してプログラムで Hive Thrift サーバーを起動し、登録済みの一時テーブルを公開しますその特定のセッション。

Python を使用して同じことを行うにはどうすればよいでしょうか。HiveThriftServer をインポートするための Python のパッケージ/API はありますか? その他の考え/推奨事項をいただければ幸いです。

データフレームの作成に pyspark を使用しました

ありがとう

ラヴィ・ナラヤナン

0 投票する
1 に答える
240 参照

apache-spark - Spark SQL(HiveContextを介したHiveクエリ)は常に31個のパーティションを作成します

Spark コードから HiveContext を使用してハイブ クエリを実行しています。実行するクエリとそのデータ量に関係なく、常に 31 個のパーティションが生成されます。誰も理由を知っていますか?定義済み/構成可能な設定はありますか? 基本的に、より多くのパーティションが必要です。

このコード スニペットを使用してハイブ クエリを実行します。

var pairedRDD = hqlContext.sql(hql).rdd.map(...)

Spark 1.3.1 を使用しています

ありがとう、ニティン

0 投票する
2 に答える
1362 参照

scala - 関数 spark scala への引数として hiveContext を渡す方法

Scala でhiveContextin関数を作成しました。このパラメーターを他の関数に渡す必要があります。これが構造です。main()hiveContext

しかし、うまくいきません。関数read()は内部で呼び出されmain()ます。

何か案が?

0 投票する
0 に答える
341 参照

sql - スパークのハイブコンテキスト

スパークで hivecontext を使用しようとしています。次のステートメントは正常に実行されています。

しかし、以下のステートメントを実行すると、

次のエラーが表示されます。

Java Package オブジェクトを呼び出すことができません

何が問題なのですか?

0 投票する
0 に答える
157 参照

apache-spark - ソース テーブルが変更されたときの Spark キャッシュの動作

Spark にキャッシュされたハイブ テーブル ("person") があります。

sqlContext はHiveContextです。

cacheTable("person")ステートメントの後に挿入されたエントリはキャッシュされますか? つまり、("Foo", 25) エントリが Spark にキャッシュされているかどうか。

そうでない場合、後で挿入されたエントリのみをキャッシュするにはどうすればよいですか? 最初にキャッシュを解除してから、テーブル全体を再度キャッシュしたくありません。

0 投票する
0 に答える
378 参照

hive - ハイブで string を bigint にキャストすると不完全なデータが返される

ハイブで完全な値を取得するにはどうすればよいですか? つまりcast('0024' as bigint)、与えるだけですが、出力として24完全なものが必要です。0024

これを行う方法はありますか?