問題タブ [delta-lake]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pyspark - pyspark を使用して jupyter ノートブックで deltalake テーブルを参照する方法
DeltaLakes
を使って使い始めようとしてPyspark
います。
deltalake を使用できるようにするために、Anaconda シェル プロンプトで pyspark を次のように呼び出します。</p>
deltalake からの参照は次のとおりです — https://docs.delta.io/latest/quick-start.html
デルタ レイクのすべてのコマンドは、Anaconda シェル プロンプトから正常に機能します。
Jupyter Notebook では、deltalake テーブルを参照するとエラーが発生します。Jupyter Notebook で実行しているコードは次のとおりです。
以下は、ノートブックの開始時にpysparkに接続するために使用しているコードです-
以下は私が得るエラーです:
Py4JJavaError: o116.save の呼び出し中にエラーが発生しました。: java.lang.ClassNotFoundException: データ ソースが見つかりませんでした: デルタ。http://spark.apache.org/third-party-projects.htmlでパッケージを見つけてください。
助言がありますか?