2

Hbase では、各行に次の列があります。

u1:chararray, u2:chararray, ..., un:chararray

u という名前の列ファミリー (utable から) 数 n は行ごとに異なる場合があります。これらすべての列に名前を付けずに (たとえば * 文字を使用して) タプルにロードしたいのですが、その方法がわかりません。

とりあえず、次の行でタプルを作成します。

qoe1 = LOAD 'hbase://utable'
       USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('u:u1, u:u2, u:u3', '-loadKey true')
       AS (ID:chararray, u1:chararray, u2:chararray, u3:chararray);

しかし、前に言ったように、固定数の列しかロードできないので、満足のいくものではありません。

何か案が?

4

3 に答える 3

-3

Pig でデータを操作するには、データのスキーマを知る必要があります。これは最も洗練された解決策ではありませんが、フィールドが 25 個を超えることはないことがわかっているため、問題に対する洗練された解決策を見つけるよりも、25 個のフィールドすべてを 1 回だけ入力してタプルに入れ、次に進みます。

于 2013-08-13T13:01:39.930 に答える