バッグ内の個々のアイテムを文字列に折りたたむインターフェイスを作成する必要があります。例: {(a),(b)} を ab に。
まず、代数インターフェイスを使用して文字列を返すことができますか、それとも整数 (Long) に制限されていますか。
次に、代数を使用するいくつかの例にアクセスできる場所はありますか (どこでも見られる COUNT の例は別として)。
Algebraic を使用して文字列を処理できるかどうかだけ答えて、既存の UDF コード (私の問題を正確に解決するコードではない) を確認できる適切な場所があるかどうかを教えてください。
これらは私が試したことです:
- バッグで機能するUDFコードをグーグルで検索します。どこにでも投稿されているCOUNTの例から離れて何も得られない
- Pig でさまざまなオプションを試しています。どうやら、残念なことに、バッグ内の個々のアイテムを逆参照することはできません。