次の SOF の質問How to run script in Pyspark and drop into IPython shell when done? pyspark スクリプトを起動する方法を示します。
%run -d myscript.py
しかし、既存の spark コンテキストにアクセスするにはどうすればよいでしょうか?
新しいものを作成するだけでは機能しません。
----> sc = SparkContext("local", 1)
ValueError: Cannot run multiple SparkContexts at once; existing
SparkContext(app=PySparkShell, master=local) created by <module> at
/Library/Python/2.7/site-packages/IPython/utils/py3compat.py:204
しかし、既存のものを使用しようとすると..既存のものは何ですか?
In [50]: for s in filter(lambda x: 'SparkContext' in repr(x[1]) and len(repr(x[1])) < 150, locals().iteritems()):
print s
('SparkContext', <class 'pyspark.context.SparkContext'>)
つまり、SparkContext インスタンスの変数はありません