scala - Spark で textinputformat.record.delimiter を設定する

翻译自：https://stackoverflow.com/questions/17692857 2013-07-17T06:40:47.560

5333 次

Spark では、次のような Hadoop 構成設定を設定できます。

System.setProperty("spark.hadoop.dfs.replication", "1")

これは機能し、レプリケーションファクターは 1 に設定されます。これが事実であると仮定すると、このパターン (通常の Hadoop 構成プロパティの前に "spark.hadoop." を追加する) は、textinputformat.record.delimiter に対しても機能すると考えました。

System.setProperty("spark.hadoop.textinputformat.record.delimiter", "\n\n")

ただし、spark はこの設定を無視しているようです。textinputformat.record.delimiterを正しい方法で設定していますか? を設定する簡単な方法はありますかtextinputformat.record.delimiter。InputFormat2 つの改行で区切られたレコードを取得する必要があるだけなので、自分でを書くことは避けたいと思います。

scala - Spark で textinputformat.record.delimiter を設定する

1 に答える 1

Related

Reference