問題タブ [hivecontext]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sparkr - HiveContext を使用して、Spark で最小値を含む行を除く行を選択します
タイムスタンプとマシン ID を含む Spark データ フレームがあります。各グループから最も低いタイムスタンプ値を削除したいと考えています。次のコードを試しました:
しかし、次のエラーが発生しています。
何が問題ですか?HiveContext が EXCEPT キーワードをサポートしていない場合、HiveContext で同じことを行う同義の方法は何ですか?
python - Python でプログラムによって HiveThriftServer を起動する
spark-shell (scala) では、org.apache.spark.sql.hive.thriftserver._ をインポートして、HiveThriftServer2.startWithContext(hiveContext) として特定のハイブ コンテキストに対してプログラムで Hive Thrift サーバーを起動し、登録済みの一時テーブルを公開しますその特定のセッション。
Python を使用して同じことを行うにはどうすればよいでしょうか。HiveThriftServer をインポートするための Python のパッケージ/API はありますか? その他の考え/推奨事項をいただければ幸いです。
データフレームの作成に pyspark を使用しました
ありがとう
ラヴィ・ナラヤナン
apache-spark - Spark SQL(HiveContextを介したHiveクエリ)は常に31個のパーティションを作成します
Spark コードから HiveContext を使用してハイブ クエリを実行しています。実行するクエリとそのデータ量に関係なく、常に 31 個のパーティションが生成されます。誰も理由を知っていますか?定義済み/構成可能な設定はありますか? 基本的に、より多くのパーティションが必要です。
このコード スニペットを使用してハイブ クエリを実行します。
var pairedRDD = hqlContext.sql(hql).rdd.map(...)
Spark 1.3.1 を使用しています
ありがとう、ニティン
scala - 関数 spark scala への引数として hiveContext を渡す方法
Scala でhiveContext
in関数を作成しました。このパラメーターを他の関数に渡す必要があります。これが構造です。main()
hiveContext
しかし、うまくいきません。関数read()
は内部で呼び出されmain()
ます。
何か案が?
sql - スパークのハイブコンテキスト
スパークで hivecontext を使用しようとしています。次のステートメントは正常に実行されています。
しかし、以下のステートメントを実行すると、
次のエラーが表示されます。
Java Package オブジェクトを呼び出すことができません
何が問題なのですか?
apache-spark - ソース テーブルが変更されたときの Spark キャッシュの動作
Spark にキャッシュされたハイブ テーブル ("person") があります。
sqlContext はHiveContextです。
cacheTable("person")ステートメントの後に挿入されたエントリはキャッシュされますか? つまり、("Foo", 25) エントリが Spark にキャッシュされているかどうか。
そうでない場合、後で挿入されたエントリのみをキャッシュするにはどうすればよいですか? 最初にキャッシュを解除してから、テーブル全体を再度キャッシュしたくありません。
hive - ハイブで string を bigint にキャストすると不完全なデータが返される
ハイブで完全な値を取得するにはどうすればよいですか? つまりcast('0024' as bigint)
、与えるだけですが、出力として24
完全なものが必要です。0024
これを行う方法はありますか?