0

バージョン:
Accumulo 1.5
Pig 0.10

試行済み:
accumulo-pig を使用して、Pig から Accumulo にデータを読み書きします。
エラーが発生しました - このエラーを回避するための洞察をいただければ幸いです。
C# コードベースで Accumulo Thrift Proxy を使用しているため、Accumulo 1.4 への切り替えはオプションではありません。

影響:
これは現在、プロジェクトの障害となっています。

ソース参照:
ソースコード - https://git-wip-us.apache.org/repos/asf/accumulo-pig.git

エラー:
Pig から Accumulo でデータセットを読み取ろうとすると、次のエラーが発生します。

org.apache.pig.backend.executionengine.ExecException: エラー 2118: AccumuloInputFormat のコネクタ情報は、ジョブごとに 1 回しか設定できません

コードスニペット:

DATA = LOAD 'accumulo://departments?instance=indra&user=root&password=xxxxxxx&zookeepers=cdh-dn01:2181' using org.apache.accumulo.pig.AccumuloStorage() AS (row, cf, cq, cv, ts, val);
dump DATA;
4

1 に答える 1

0

同じリポジトリから ACCUMULO-1783-1.5 ブランチを使用してみてください。Pig が InputFormat を設定する方法は、Accumulo が InputFormats を設定する方法とうまく連携しません (特に、Accumulo は、構成に対して同じ静的メソッドを複数回呼び出すことは決してないという面白い主張をします)。

私は豚 0.12 を使用しています。0.12 とは対照的に、0.10 が InputFormats をセットアップする方法に違いがあるとは思えませんが、私は YMMV に肯定的ではありません。

上記のブランチに、前述の Hadoop バージョンの制限を取り除く修正をプッシュしました。

于 2013-12-30T17:49:04.197 に答える