1

Beeline スクリプトは、Spark/bin にある HiveServer2 に接続する方法の 1 つです。

以下のように簡単なクエリを実行しました。

ここに画像の説明を入力

出力では、Map-Reduce が起動されていることがわかります。

従来の map-reduce 実行フレームワークに従っているため、Spark のビーライン機能の利点を理解しようとしていますか?

ビーラインでSpark RDD機能を使用できますか?

前もって感謝します。

4

3 に答える 3

2

Beeline は Spark の一部ではありません。

これは単なる HiveServer2 クライアントです。

Spark シェルを起動してシェル内でクエリを実行できますが、これは Beeline とは関係ありません。Beeline は Spark とは何の関係もありません。

于 2016-03-24T21:28:35.040 に答える
1

これは 1 つの方法です。Mapreduce を使用したくない場合は、エンジンとして使用できます。これはTEZ、メモリ内で MR よりも高速に実行されます。

SET hive.execution.engine=tez;

ただし、spark ifrom beeline を実行することはできません。これは、hiveserver2 に接続するスタンドアロン アプリケーションです。

于 2016-03-25T17:20:19.733 に答える
0

@MondayMonkeyが言ったことに追加します。Beeline は Spark エンジンの一部ではありません。これは、Spark の Thriftserver (JDBC サーバー) に接続する単なる JDBC クライアントです。Beeline は、Spark SQL とやり取りするための SQL インターフェイスを提供します。

于 2018-05-11T14:41:04.563 に答える