0

oue データ ウェアハウスはハイブに基づいています。データをハイブからグリーンプラムに変換する必要があります。gphdfs で外部テーブルを使用したいのですが、何か問題があるようです。テーブル作成スクリプトは

CREATE EXTERNAL TABLE flow.http_flow_data(like flow.zb_d_gsdwal21001)
LOCATION ('gphdfs://mdw:8081/user/hive/warehouse/flow.db/d_gsdwal21001/prov_id=018/day_id=22/month_id=201202/data.txt')
FORMAT 'TEXT' (DELIMITER '      ');

私たちが走るとき

bitest=# select * from flow.http_flow_data limit 1;
ERROR:  external table http_flow_data command ended with error. sh: java: command not found  (seg12 slice1 sdw3:40000 pid=17778)
DETAIL:  Command: gphdfs://mdw:8081/user/hive/warehouse/flow.db/d_gsdwal21001/prov_id=018/day_id=22/month_id=201202/data.txt

Hadoop は 1.0 で、greenplum は 4.1.2.1 です。

gp が Hadoop にアクセスできるようにするために何かを設定する必要があるかどうかを知りたい

4

3 に答える 3

0

month_id=201202 ディレクトリをリッスンするためにポート (8081) を開きましたか?

于 2012-07-25T22:05:50.357 に答える
0

Greenplum システムに Java がインストールされていることを確認しましたか? これは、gphdfs が機能するために必要です。

于 2016-01-21T22:03:13.873 に答える
0

管理者ガイドを再確認します。gphdfs を使用できると思いますが、greenplum 4.2 までは使用できません。

于 2013-02-01T21:42:11.187 に答える