0

Flume でディレクトリをスプールし、ファイルを hdfs にアップロードしています。これらは txt/csv ファイルであり、hdfs でその形式にする必要があります。しかし、Flume はそれらをバイナリ ファイルとしてロードしています...

これが私の設定です:

tier1.sources  = source1
tier1.channels = channel1
tier1.sinks    = sink1

tier1.sources.source1.type     = spooldir
tier1.sources.source1.channels = channel1
tier1.sources.source1.spoolDir = /var/data
tier1.sources.source1.fileHeader = false
tier1.sources.source1.deletePolicy = immediate
tier1.channels.channel1.type   = memory
tier1.sinks.sink1.type         = hdfs
tier1.sinks.sink1.channel      = channel1
tier1.sinks.sink1.hdfs.path = /user/hdfs/%y-%m-%d/
tier1.sinks.sink1.hdfs.writeFormat=Text
tier1.sinks.sink1.hdfs.useLocalTimeStamp = true
tier1.sinks.sink1.hdfs.rollInterval = 30

tier1.channels.channel1.capacity = 100

Flume が txt ファイルを txt ファイルとしてロードするには、何を変更すればよいですか?

4

1 に答える 1

1

これで問題が解決するはずです:

tier1.sinks.sink1.hdfs.fileType = データストリーム

tier1.sinks.sink1.hdfs.writeFormat = テキスト

于 2014-07-10T14:14:43.440 に答える