Bluemix オブジェクト ストレージに DataFrame を Parquet ファイルとして保存するために、Spark Notebook を実行しています。
ノートブックを再実行するときに、Parquet ファイルを上書きしたいと考えています。しかし、実際にはデータを追加しているだけです。
iPython コードのサンプルの下:
df = sqlContext.sql("SELECT * FROM table")
df.write.parquet("swift://my-container.spark/simdata.parquet", mode="overwrite")