問題タブ [apache-spark-dataset]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

908 問題

0 投票する

14 に答える

148824 参照

dataframe - Spark の DataFrame、Dataset、および RDD の違い

RDDApache Spark のとDataFrame (Spark 2.0.0 DataFrame はの単なるタイプエイリアスですDataset[Row])の違いは何ですか?

一方を他方に変換できますか？

dataframe apache-spark apache-spark-sql rdd apache-spark-dataset

2015-07-20T02:31:21.023

0 投票する

1 に答える

20217 参照

performance - DataFrame / データセットグループ別の動作/最適化

df次の列で構成されるDataFrameがあるとします。

名前、姓、サイズ、幅、長さ、重さ

次に、いくつかの操作を実行します。たとえば、Size と Width に関するデータを含む DataFrame をいくつか作成します。

お気づきのように、Length などの他の列はどこにも使用されていません。Spark はシャッフルフェーズの前に冗長な列を削除するほどスマートですか、それとも持ち越されますか? ウィルランニング：

グループ化が何らかの形でパフォーマンスに影響を与える前に？

performance apache-spark dataframe apache-spark-sql apache-spark-dataset

2015-10-02T08:08:16.750

0 投票する

2 に答える

20901 参照

java - JavaのApache SparkでDataFrameをDatasetに変換するには?

DataFrame を Scala の Dataset に非常に簡単に変換できます。

しかし、Java バージョンでは、Dataframe を Dataset に変換する方法がわかりませんか? 何か案が？

私の努力は：

しかし、コンパイラは言う：

編集（解決策）：

@Leet-Falconの回答に基づくソリューション：

java apache-spark spark-dataframe apache-spark-dataset

2016-01-07T11:35:31.597

0 投票する

3 に答える

22048 参照

scala - ケースクラスを使用して JSON をエンコードすると、「データセットに格納されている型のエンコーダーが見つかりません」というエラーが表示されるのはなぜですか?

私はスパークジョブを書きました：

IDE で main 関数を実行すると、次の 2 つのエラーが発生します。

しかし、Spark Shell では、このジョブをエラーなしで実行できます。何が問題ですか？

scala apache-spark apache-spark-dataset apache-spark-encoders

2016-01-11T06:46:13.547

0 投票する

2 に答える

3024 参照

apache-spark - データセットをバイナリファイル/寄木細工の床にシリアル化する方法は?

をシリアル化するにはどうすればよいDataSetですか? Encoderを使用してバイナリファイルを作成する方法はありますか、それともに変換してからDataFrame寄木細工として保存する必要がありますか?

apache-spark apache-spark-dataset

2016-01-12T12:36:56.880

0 投票する

1 に答える

830 参照

apache-spark - Spark SQL の Dataset.filter に関するエラー

MySQL で見つかるレコードのみを含むようにデータセットをフィルター処理したいと考えています。

データセットは次のとおりです。

MySQL のテーブルは次のとおりです。

これは私のコードです（spark-shellで実行しています）：

しかし、「java.lang.NullPointerException」が発生します

私はテストしました

正しい結果 1 と 0 を得ることができます。

フィルターの問題は何ですか？

apache-spark apache-spark-sql apache-spark-dataset

2016-01-15T09:51:28.187

0 投票する

1 に答える

452 参照

scala - Apache Spark で GroupedDataset の操作によって作成された新しい列の名前を変更する方法は?

count結果をDataFrameに変換せずに、操作の列の名前を変更するにはどうすればよいですか?

scala apache-spark spark-dataframe apache-spark-dataset

2016-01-17T12:43:19.123

0 投票する

1 に答える

674 参照

scala - Apache Spark データセットで enum 列のケースクラスを作成するには?

データをデータセットに変換したい。列名は、storyType (小、中、大、特大) です。したがって、この状況でケースクラスを作成する方法がわかりません

scala apache-spark case-class apache-spark-dataset

2016-01-30T06:57:18.357

1 2 3 4 5 6 7 8 9 10