スパークシェルでは、以下のコードを使用してcsvファイルから読み取ります
val df = spark.read.format("org.apache.spark.csv").option("header", "true").option("mode", "DROPMALFORMED").csv("/opt/person.csv") //spark here is the spark session
df.show()
これが10行を表示すると仮定します。df.show()
csv を編集して新しい行を追加した場合、もう一度呼び出すと新しい行が表示されますか? もしそうなら、それはデータフレームがすべてのアクションで外部ソース (この場合は csv ファイル) から読み取ることを意味しますか?
データフレームをキャッシュしていないか、spark セッションを使用してデータフレームを再作成していないことに注意してください