問題タブ [shark-sql]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

59 問題

0 投票する

6 に答える

17755 参照

hadoop - ODBC経由でSpark SQLに接続

このページによると: https://spark.apache.org/sql/ ODBC または JDBC 経由で既存の BI ツールを Spark SQL に接続できます。 Spark SQL のスクリーンショット

これは基本的にEOLであるため、サメを意味するものではありません。

このため、私たちは Shark での開発を別のプロジェクトとして終了し、すべての開発リソースを Spark の新しいコンポーネントである Spark SQL に移しています。

BI ツール (Tableau など) は、ODBC 経由でサメの SQL にどのように接続しますか?

2014-09-08T18:05:45.263

0 投票する

1 に答える

88 参照

apache-spark - RDD から保存されたテキストファイルから Shark クエリを作成する方法は?

私は持っていて、次のJavaPairRDD<String, String> resultsように呼び出して保存します：

次に、次のようなファイルのコンテンツを取得します。

ここで、Shark を使用して次のような 3 つのフィールドを持つテーブルを作成します。

どうやってやるの？

apache-spark shark-sql apache-spark-sql

2014-09-28T15:26:29.957

0 投票する

1 に答える

603 参照

hadoop - シャークとスパークのどちらがスピードに優れているか

この2つについて非常に混乱しています。サメはハイブと同じで、100倍高速で、スパークで動作することを知っています。スパークとサメの主な違いを知りたいです。どちらがより速いという意味です。

スパークを使用する必要があるとき、またはサメが必要なとき?????

hadoop hive apache-spark shark-sql

2014-11-21T13:08:49.910

0 投票する

1 に答える

1416 参照

apache-spark - SPARK - グループごとのクエリで関数を使用する方法

SHARKクエリをSPARKに移行します。

以下は、group by 句で関数を使用するサンプルのSHARKクエリです。

これと同じクエリがSPARK sql で機能しないため、以下のエラーが発生します。

エラー: org.apache.spark.sql.catalyst.errors.package$TreeNodeException: 式が GROUP BY にありません。

ソリューションの一部として、以下の SPARK クエリを使用しています。これは機能していますが、コードの変更が必要です。それは私の既存のプロジェクトに大きな影響を与えます。したがって、誰もが最小限の影響でより良いソリューションを手に入れることができます。

apache-spark shark-sql

2015-01-08T13:09:09.190

0 投票する

1 に答える

138 参照

hadoop - テーブルに重複する行が含まれている場合はブール値 (1 または 0) を返します

Hive 0.9 のテーブルに重複がある場合、ブール値を返したいと思います。今のところ、これを行っています。

しかし、これは私にエラーを与えます:

「'where''v'''付近の入力を認識できません。」サブクエリソース [DB エラーコード = 11] で "

どこが間違っているのか、ここで何が欠けているのかわかりません!

hadoop apache-spark hive hiveql shark-sql

2015-09-09T22:43:46.520

1 2 3 4 5 6 7 8 9 10

問題タブ [shark-sql]

hadoop - ODBC経由でSpark SQLに接続

apache-spark - RDD から保存されたテキスト ファイルから Shark クエリを作成する方法は?

hadoop - シャークとスパークのどちらがスピードに優れているか

apache-spark - SPARK - グループごとのクエリで関数を使用する方法

hadoop - テーブルに重複する行が含まれている場合はブール値 (1 または 0) を返します

Reference

apache-spark - RDD から保存されたテキストファイルから Shark クエリを作成する方法は?