Apache Spark と比較して、Apache Spark2 がもたらす改善点は何ですか?
- アーキテクチャの観点から
- アプリケーションの観点から
- 以上
Apache Spark と比較して、Apache Spark2 がもたらす改善点は何ですか?
Apache Spark 2.0.0 API は 1.X とほぼ同じままであり、Spark 2.0.0 には API 破壊的変更があります
Apache Spark 2.0.0は、2.x ラインの最初のリリースです。主な更新は、API の使いやすさ、SQL 2003 のサポート、パフォーマンスの向上、構造化ストリーミング、R UDF のサポート、および操作の改善です。
スパーク 2 の新機能:
次の点の更新が説明されているSpark リリース 2.0.0を確認できます。
一言で言えば、DAG と RDD は依然として最も重要な部分であるため、アーキテクチャに関して大きな違いはありません。
ただし、Spark 2.0 はより最適化されており、DataSet Api を備えているため、開発者の手にはるかに強力です。つまり、アーキテクチャは同じで、Spark 2.0 が最適化され、豊富な API セットを提供するだけです。
これらは、Apache Spark 2.0 によって提供される主なものです。
詳細については、こちらをご覧ください: https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions