0

Hawq 2.0.0 をインストールした 5 ノードの Hortonworks クラスター (バージョン - 2.4.2) があります。

これらの 5 つのノードは次のとおりです。 エッジ マスター (名前ノード) ノード 1 (データ ノード 1) ノード 2 (データ ノード 2) ノード 3 (データ ノード 3)

このリンクに従って、Hawq を HDP にインストールしました - http://hdb.docs.pivotal.io/hdb/install/install-ambari.html

Hawq コンポーネントは、次のノードにインストールされます。

Hawq マスター - ノード 1 Hawq スタンバイ マスター - ノード 2

Hawq セグメント - ノード 1、ノード 2、ノード 3

インストール時に、Hawq マスター、Hawq スタンバイ マスター、hawq セグメントは正常にインストールされましたが、Ambari の Hawq インストーラーによって実行される基本的な Hawq テストは失敗しました。

以下、インストーラによる操作

2016-06-30 00:24:22,513 - --- Check state of HAWQ cluster ---
2016-06-30 00:24:22,513 - Executing hawq status check...
2016-06-30 00:24:22,514 - Command executed: su - gpadmin -c "ssh -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null node1.localdomain \"source /usr/local/hawq/greenplum_path.sh && hawq state -d /data/hawq/master \" "
2016-06-30 00:24:23,343 - Output of command:
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--HAWQ instance status summary
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:------------------------------------------------------
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Master instance                                = Active
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Master standby                                 = node2.localdomain
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Standby master state                           = Standby host passive
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total segment instance count from config file  = 3
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:------------------------------------------------------ 
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Segment Status                                    
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:------------------------------------------------------ 
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total segments count from catalog      = 1
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total segment valid (at master)        = 0
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total segment failures (at master)     = 3
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total number of postmaster.pid files missing   = 0
20160630:00:24:23:032731 hawq_state:node1:gpadmin-[INFO]:--   Total number of postmaster.pid files found     = 3


2016-06-30 00:24:23,344 - --- Check if HAWQ can write and query from a table ---
2016-06-30 00:24:23,344 - Dropping ambari_hawq_test table if exists
2016-06-30 00:24:23,344 - Command executed: su - gpadmin -c "ssh -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null node1.localdomain \"export PGPORT=5432 && source /usr/local/hawq/greenplum_path.sh && psql -d template1 -c \\\"DROP  TABLE IF EXISTS ambari_hawq_test;\\\" \" "
2016-06-30 00:24:23,436 - Output:
DROP TABLE

2016-06-30 00:24:23,436 - Creating table ambari_hawq_test
2016-06-30 00:24:23,436 - Command executed: su - gpadmin -c "ssh -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null node1.localdomain \"export PGPORT=5432 && source /usr/local/hawq/greenplum_path.sh && psql -d template1 -c \\\"CREATE  TABLE ambari_hawq_test (col1 int) DISTRIBUTED RANDOMLY;\\\" \" "
2016-06-30 00:24:23,693 - Output:
CREATE TABLE

2016-06-30 00:24:23,693 - Inserting data to table ambari_hawq_test
2016-06-30 00:24:23,693 - Command executed: su - gpadmin -c "ssh -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null node1.localdomain \"export PGPORT=5432 && source /usr/local/hawq/greenplum_path.sh && psql -d template1 -c \\\"INSERT INTO  ambari_hawq_test SELECT * FROM generate_series(1,10);\\\" \" 

"

--- 上記のように、テーブルの削除と作成は実行されましたが、挿入操作は成功しませんでした。

そのため、Hawq マスター ノード (node1) で手動で挿入コマンドを実行しました。

手動で実行する手順は次のとおりです。

[root@node1 ~]# su - gpadmin
[gpadmin@node1 ~]$ psql
psql (8.4.20, server 8.2.15)
WARNING: psql version 8.4, server version 8.2.
         Some psql features might not work.
Type "help" for help.

gpadmin=#
gpadmin=# \c gpadmin
psql (8.4.20, server 8.2.15)
WARNING: psql version 8.4, server version 8.2.
         Some psql features might not work.
You are now connected to database "gpadmin".
gpadmin=# create table test(name varchar);
gpadmin=# insert into test values('vikash');

-- 上記の挿入操作は、長時間の後にエラーをスローしました。

エラー: リソース マネージャーからリソースを取得できませんでした。使用可能なクラスターがないため、リソース要求がタイムアウトしました (pquery.c:804)

また、node1 の hawq セグメント ログは次のようになります。

[root@node1 ambari-agent]# tail -f /data/hawq/segment/pg_log/hawq-2016-06-30_045853.csv
2016-06-30 05:10:24.522688 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 192.168.122.1"
,,,,,,,0,,"network_utils.c",210,
2016-06-30 05:10:54.603726 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 127.0.0.1",,,,
,,,0,,"network_utils.c",210,
2016-06-30 05:10:54.603769 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 2.10.1.71",,,,
,,,0,,"network_utils.c",210,
2016-06-30 05:10:54.603778 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 192.168.122.1"
,,,,,,,0,,"network_utils.c",210,
2016-06-30 05:11:24.625919 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 127.0.0.1",,,,
,,,0,,"network_utils.c",210,
2016-06-30 05:11:24.626088 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 2.10.1.71",,,,
,,,0,,"network_utils.c",210,
2016-06-30 05:11:24.626129 EDT,,,p248618,th-1357371264,,,,0,,,seg-10000,,,,,"LOG","00000","Resource manager discovered local host IPv4 address 192.168.122.1"
,,,,,,,0,,"network_utils.c",210,

「gp_segment_configuration」も確認しようとしました

gpadmin=# select * from gp_segment_configuration
gpadmin-# ;
 registration_order | role | status | port  |     hostname      |  address  |            description
--------------------+------+--------+-------+-------------------+-----------+------------------------------------
                 -1 | s    | u      |  5432 | node2.localdomain | 2.10.1.72 |
                  0 | m    | u      |  5432 | node1             | node1     |
                  1 | p    | d      | 40000 | node1.localdomain | 2.10.1.71 | resource manager process was reset
(3 rows)

注 : hawq-site.xml では、リソース管理タイプがドロップダウンから「YARN」ではなく「STANDALONE」として選択されています。

ここでの問題は何ですか?前もって感謝します !!!

4

2 に答える 2