こんにちは、Hadoop Pig でルックアップ ロジックを実装する方法を知りたいです。私は一連のレコードを持っています。たとえば、ウェブログ ユーザーの場合です。最初の訪問 (現在ではありません) からいくつかのフィールドを取得するために戻る必要があります。
これは Java で実行できますが、Hadoop ピッグでこれを実装する方法はありますか。
例:
と で識別される 1 人の特定のユーザーをトラバースする場合、そのユーザーの最初の値を に出力するcol1
とします。この場合は「1」です。col2
lookup_col
col1 col2 lookup_col
---- ---- -----
326 8979 1
326 8979 4
326 8979 3
326 8979 0