私はPyspark jupyter/pyspark-notebookの Docker コンテナーを使用してUbuntu 15.10で作業しています。すべての依存関係とともに folium をインストールし、Pyspark スクリプトをコンテナー内で実行する必要があります。Docker を正常にインストールし、イメージをプルして、コマンドで実行しました
docker run -d -p 8888:8888 -p 4040:4040 -v /home/$MYUSER/$MYPROJECT:/home/jovyan/work jupyter/pyspark-notebook
次に、コード例を問題なく実行します
import pyspark
sc = pyspark.SparkContext('local[*]')
# do something to prove it works
rdd = sc.parallelize(range(1000))
rdd.takeSample(False, 5)
/opt/conda
(ドキュメントに記載されているように)でconda環境を探しましたが、フォルダーにcondaがありません/opt
。次に、すべての依存関係を含む miniconda3 と folium を通常の Python パッケージ (Docker は関係ありません) としてインストールしました。
うまくいきません。イメージを実行してパッケージをインポートしようとするとimport folium
、folium パッケージが見つかりません。
ImportErrorTraceback (most recent call last)
<ipython-input-1-af6e4f19ef00> in <module>()
----> 1 import folium
ImportError: No module named 'folium'
したがって、問題は次の 2 つの質問に減らすことができます。
- コンテナーのcondaはどこにありますか?
- 必要な Python パッケージをコンテナーにインストールするにはどうすればよいですか?