Hadoop MapReduceで次のアーキテクチャが可能ですか?
分散Key-Valueストアが使用されます(HBase)。したがって、値とともに、値に関連付けられたタイムスタンプがあります。Map&Reduceタスクは繰り返し実行されます。マップは、各反復で、前の反復でストアに追加された値(おそらく最新のタイムスタンプを持つ値)を取り込む必要があります。Reduceは、Mapの出力と、reduceが現在の反復で処理する必要のあるキーと一致するキーを持つストアからのペアを取り込む必要があります。reduceの出力はストアに送られます。
これが可能な場合は、通常の操作の代わりに上記の操作が行われるように、どのクラス(たとえば、InputFormat、Reduceのrun())を拡張する必要があります。これが不可能な場合、同じことを達成するための代替手段はありますか?