0

IPアドレスのリストがあります。各 IP に国を割り当てる必要があります。たとえば、http://www.ip2nation.com/はこのサービスを提供します。IP2Country のデータベースをいくつか見つけましたが、それを pig と統合するにはどうすればよいですか?

入力:

14.59.63.28
145.89.87.211
54.27.253.89
98.201.50.22
116.48.29.143
145.89.87.211
20.109.204.65
20.109.204.65

期待される出力:

14.59.63.28     country1
145.89.87.211   country2
54.27.253.89    country3
98.201.50.22    country4
116.48.29.143   country5
145.89.87.211   country2
20.109.204.65   country6
20.109.204.65   country6
4

1 に答える 1

0

そのデータベースから IP と国名のデータベースの抽出を取得する必要があります。次に、その抽出されたデータを使用して、ストリーミングするデータとの結合を実行します。

素直に参加します。パフォーマンスを向上させるために、Pig http://pig.apache.org/docs/r0.7.0/piglatin_ref1.html#Replicated+Joinsでレプリケートされた結合を確認できます。

于 2013-10-08T18:42:53.277 に答える