oue データ ウェアハウスはハイブに基づいています。データをハイブからグリーンプラムに変換する必要があります。gphdfs で外部テーブルを使用したいのですが、何か問題があるようです。テーブル作成スクリプトは
CREATE EXTERNAL TABLE flow.http_flow_data(like flow.zb_d_gsdwal21001)
LOCATION ('gphdfs://mdw:8081/user/hive/warehouse/flow.db/d_gsdwal21001/prov_id=018/day_id=22/month_id=201202/data.txt')
FORMAT 'TEXT' (DELIMITER ' ');
私たちが走るとき
bitest=# select * from flow.http_flow_data limit 1;
ERROR: external table http_flow_data command ended with error. sh: java: command not found (seg12 slice1 sdw3:40000 pid=17778)
DETAIL: Command: gphdfs://mdw:8081/user/hive/warehouse/flow.db/d_gsdwal21001/prov_id=018/day_id=22/month_id=201202/data.txt
Hadoop は 1.0 で、greenplum は 4.1.2.1 です。
gp が Hadoop にアクセスできるようにするために何かを設定する必要があるかどうかを知りたい