1

hbase0.94.10 および hadoop1.1.2 で apache-flume1.4.0 を使用しています。Flume エージェントには、ソースとしてスプール ディレクトリがあり、シンクおよびファイル チャネルとして hbase があります。正常に実行されていますが、非常に遅いです。hbase の書き込みパフォーマンスを改善するにはどうすればよいですか。

Flume エージェントの設定は次のとおりです。

agent1.sources = spool
agent1.channels = fileChannel
agent1.sinks = sink

agent1.sources.spool.type = spooldir
agent1.sources.spool.spoolDir = /opt/spoolTest/
agent1.sources.spool.fileSuffix = .completed
agent1.sources.spool.channels = fileChannel
#agent1.sources.spool.deletePolicy = immediate

agent1.sinks.sink.type = org.apache.flume.sink.hbase.HBaseSink
agent1.sinks.sink.channel = fileChannel
agent1.sinks.sink.table = test
agent1.sinks.sink.columnFamily = log
agent1.sinks.sink.serializer = org.apache.flume.sink.hbase.RegexHbaseEventSerializer
agent1.sinks.sink.serializer.regex = (.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)^C(.*)
agent1.sinks.sink.serializer.colNames = id,no_fill_reason,adInfo,locationInfo,handsetInfo,siteInfo,reportDate,ipaddress,headerContent,userParaContent,reqParaContent,otherPara,others,others1
agent1.sinks.sink1.batchSize = 100

agent1.channels.fileChannel.type = file
agent1.channels.fileChannel.checkpointDir = /usr/flumeFileChannel/chkpointFlume
agent1.channels.fileChannel.dataDirs = /usr/flumeFileChannel/dataFlume
agent1.channels.fileChannel.capacity = 10000000
agent1.channels.fileChannel.transactionCapacity = 100000

容量、ファイル チャネルのトランザクション容量、およびシンクのバッチ サイズとは何ですか。

私を助けてください。前もって感謝します。

4

0 に答える 0