0

バッグ内の個々のアイテムを文字列に折りたたむインターフェイスを作成する必要があります。例: {(a),(b)} を ab に。

まず、代数インターフェイスを使用して文字列を返すことができますか、それとも整数 (Long) に制限されていますか。

次に、代数を使用するいくつかの例にアクセスできる場所はありますか (どこでも見られる COUNT の例は別として)。

Algebraic を使用して文字列を処理できるかどうかだけ答えて、既存の UDF コード (私の問題を正確に解決するコードではない) を確認できる適切な場所があるかどうかを教えてください。

これらは私が試したことです:

  1. バッグで機能するUDFコードをグーグルで検索します。どこにでも投稿されているCOUNTの例から離れて何も得られない
  2. Pig でさまざまなオプションを試しています。どうやら、残念なことに、バッグ内の個々のアイテムを逆参照することはできません。
4

1 に答える 1

0

最後に、これは私が考え出したものです:

  1. 問題が GROUP と同じくらい効率的に JOIN によって解決できる場合は、それを実行する必要があります。グループは、扱いにくいバッグを作成します。

  2. バッグを扱うために ALGEBRAIC を使用する義務はありません。代わりに、EVAL UDF を記述できます。ただし、バッグのサイズが大きい場合は、はるかに遅くなります。

于 2013-03-13T17:07:18.283 に答える