私はHadoopを初めて使用し、現在、キーが間隔である2つのデータソース([date-begin / date-end]など)を結合しようとしています。例えば:
input1:
20091001-20091002 A
20091011-20091104 B
20080111-20091103 C
(...)
input2:
20090902-20091003 D
20081015-20091204 E
20040011-20050101 F
(...)
key1がkey2とオーバーラップしているすべてのレコードを検索したいと思います。Hadoopで可能ですか?実装例はどこにありますか?
ありがとう。