2

spark セッションを呼び出して、それを使用して csv ファイルを開くために、databricks で次のコードを実行しようとしています。

spark
fireServiceCallsDF = spark.read.csv('/mnt/sf_open_data/fire_dept_calls_for_service/Fire_Department_Calls_for_Service.csv', header=True, inferSchema=True)

そして、次のエラーが表示されます。

NameError:name 'spark' is not defined

何が間違っているのでしょうか?

私も実行しようとしました:

 from pyspark.sql import SparkSession

しかし、次のような応答がありました。

ImportError: cannot import name SparkSession

それが役立つ場合は、次の例に従ってみます (17:30 から見るとよくわかります): https://www.youtube.com/watch?v=K14plpZgy_c&list=PLIxzgeMkSrQ-2Uizm4l0HjNSSy2NxgqjX

4

2 に答える 2

-2

使用しているサンプル コードは、Spark バージョン 2.x 用であることに注意してください。

「spark」と「SparkSession」は、Spark 1.x では使用できません。表示されるエラー メッセージは、バージョンの問題 (Spark 1.x) の可能性を示しています。

使用している Spark のバージョンを確認してください。

于 2016-11-23T16:44:56.373 に答える