1

異なるイベントからの 2 つのリストがあります。これらのリストの中から一致する人の名前と、一致する会社を探したいと思います。各リストに同じ名前の人がいて、同じ人ではない可能性があることは理解していますが、一致する人を見つけるのに役立ちます.

最初のリストの例:
名前、会社、役職
John Doe、ACME Corporation、エレファント トレーナー
Jane Smith、ACME Corporation、CEO
John Smith、Widgets-R-Us、Janitor +10,000

2 番目のリストの例:
Name, Company
Fred Smith, ACME Corporation
John Smith, Widgets-R-Us
John Smith, Company XYZ
Jane Smith, Company XYZ +10,000

望ましい出力
の一致する名前:
John Smith
Jane Smith

マッチング企業:
ACME Corporation
Widgets-R-Us

AWS 環境で実行していますが、Hadoop は初めてです。プログラミング言語は何でも構いません。Excelでこれを行う方法は知っていますが、名前のリストを増やして(それぞれ独自のCSVファイルに)、時間の経過とともにこれをスケーリングできるようにしたいと考えています。

4

1 に答える 1