18

opentsdb からのデータを格納するために hbase クラスターをセットアップしました。最近、一部のノードの再起動により、hbase はテーブル「tsdb」を失いました。hbase のマスター ノード ページでは引き続き表示できますが、クリックすると tableNotFoundException が発生します。

org.apache.hadoop.hbase.TableNotFoundException: tsdb
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegionInMeta(HConnectionManager.java:952)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegion(HConnectionManager.java:818)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.locateRegion(HConnectionManager.java:782)
    at org.apache.hadoop.hbase.client.HTable.finishSetup(HTable.java:249)
    at org.apache.hadoop.hbase.client.HTable.<init>(HTable.java:213)
    at org.apache.hadoop.hbase.client.HTable.<init>(HTable.java:171)
......

「tsdb」テーブルを見つけようとしてhbaseシェルに入りましたが、同様のメッセージが表示されました

hbase(main):018:0> scan 'tsdb'
ROW                                                          COLUMN+CELL

ERROR: Unknown table tsdb!

ただし、このテーブルを再作成しようとすると、hbase シェルからテーブルが既に存在することがわかりました...

hbase(main):013:0> create 'tsdb', {NAME => 't', VERSIONS => 1, BLOOMFILTER=>'ROW'}

ERROR: Table already exists: tsdb!

また、hbase シェルでテーブルを一覧表示することもできます

hbase(main):001:0> list
TABLE
tsdb
tsdb-uid
2 row(s) in 0.6730 seconds

ログを見ると、これが問題の原因であることがわかりました

2012-05-14 12:06:22,140 WARN org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation: Encountered problems when prefetch META table:
org.apache.hadoop.hbase.TableNotFoundException: Cannot find row in .META. for table: tsdb, row=tsdb,,99999999999999
    at org.apache.hadoop.hbase.client.MetaScanner.metaScan(MetaScanner.java:157)
    at org.apache.hadoop.hbase.client.MetaScanner.access$000(MetaScanner.java:52)
    at org.apache.hadoop.hbase.client.MetaScanner$1.connect(MetaScanner.java:130)
    at org.apache.hadoop.hbase.client.MetaScanner$1.connect(MetaScanner.java:127)

.META. に tsbb の行が見つからないと表示されますが、実際には .META. に tsdb 行があります。

hbase(main):002:0> scan '.META.'
ROW                                                          COLUMN+CELL
 tsdb,\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\ column=info:regioninfo, timestamp=1336311752799, value={NAME => 'tsdb,\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\x00\x02\x00\x00\x12\x00\x00\x03\x00\x00\x13\x00\x00\x
 x00\x02\x00\x00\x12\x00\x00\x03\x00\x00\x13\x00\x00\x05\x00 05\x00\x001,1336311752340.7cd0d2205d9ae5fcadf843972ec74ec5.', STARTKEY => '\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\x00\x02\x00\x00\x12\x00\x00\x03\x00\x00\x13\x00\
 \x001,1336311752340.7cd0d2205d9ae5fcadf843972ec74ec5.       x00\x05\x00\x001', ENDKEY => '\x00\x00\x10O\xA3\x8C\x80\x00\x00\x01\x00\x00\x0B\x00\x00\x02\x00\x00\x19\x00\x00\x03\x00\x00\x1A\x00\x00\x05\x00\x001', ENCODED => 7cd0d2205d9ae5f
                                                             cadf843972ec74ec5,}
 tsdb,\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\ column=info:server, timestamp=1337011527000, value=brycobapd01.usnycbt.amrs.bankofamerica.com:60020
 x00\x02\x00\x00\x12\x00\x00\x03\x00\x00\x13\x00\x00\x05\x00
 \x001,1336311752340.7cd0d2205d9ae5fcadf843972ec74ec5.
 tsdb,\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\ column=info:serverstartcode, timestamp=1337011527000, value=1337011518948
......

 tsdb-uid,,1336081042372.a30d8074431c6a31c6a0a30e61fedefa.   column=info:server, timestamp=1337011527458, value=bry200163111d.usnycbt.amrs.bankofamerica.com:60020
 tsdb-uid,,1336081042372.a30d8074431c6a31c6a0a30e61fedefa.   column=info:serverstartcode, timestamp=1337011527458, value=1337011519807
6 row(s) in 0.2950 seconds

これは、クラスターで「hbck」を実行した後の結果です

ERROR: Region hdfs://slave-node-1:9000/hbase/tsdb/249438af5657bf1881a837c23997747e on HDFS, but not listed in META or deployed on any region server
ERROR: Region hdfs://slave-node-1:9000/hbase/tsdb/4f8c65fb72910870690b94848879db1c on HDFS, but not listed in META or deployed on any region server
ERROR: Region hdfs://slave-node-1:9000/hbase/tsdb/63276708b4ac9f11e241aca8b56e9def on HDFS, but not listed in META or deployed on any region server
ERROR: Region hdfs://slave-node-1:9000/hbase/tsdb/e54ee4def67d7f3b6dba75a3430e0544 on HDFS, but not listed in META or deployed on any region server
ERROR: (region tsdb,\x00\x00\x0FO\xA2\xF1\xD0\x00\x00\x01\x00\x00\x0E\x00\x00\x02\x00\x00\x12\x00\x00\x03\x00\x00\x13\x00\x00\x05\x00\x001,1336311752340.7cd0d2205d9ae5fcadf843972ec74ec5.) First region should start with an empty key.  You need to  create a new region and regioninfo in HDFS to plug the hole.
ERROR: Found inconsistency in table tsdb
Summary:
  -ROOT- is okay.
    Number of regions: 1
    Deployed on:  master-node,60020,1337011518948
  .META. is okay.
    Number of regions: 1
    Deployed on:  slave-node-2,60020,1337011519845
Table tsdb is inconsistent.
    Number of regions: 5
    Deployed on:  slave-node-2,60020,1337011519845 slave-node-1,60020,1337011519807 master-node,60020,1337011518948
  tsdb-uid is okay.
    Number of regions: 1
    Deployed on:  slave-node-1,60020,1337011519807
5 inconsistencies detected.
Status: INCONSISTENT

私は走った

bin/hbase hbck -fix

残念ながら私の問題は解決しません

誰かがこれについて私を助けてくれますか

  1. このテーブル「tsdb」を復元することは可能ですか?
  2. 1 を実行できない場合、「tsdb」を適切に削除して新しいものを作成する方法は提案されていますか?
  3. ノードを再起動する最も推奨される方法を教えていただければ幸いです。現在、マスターノードを常に稼働させています。他のノードでは、再起動直後にこのコマンドを実行します。

指図:

# start data node
bin/hadoop-daemon.sh start datanode
bin/hadoop-daemon.sh start jobtracker    
# start hbase
bin/hbase-daemon.sh start zookeeper
bin/hbase-daemon.sh start regionserver 

どうもありがとう!

4

10 に答える 10

2

なぜスキャンできないのかよくわかりません。ただし、テーブルを再作成するには、次のことを試してください。

1)このテーブルの.METAテーブルのすべてのエントリを手動で削除し、

2)このテーブルに対応するディレクトリをHDFSから削除します

その後、もう一度テーブルを作成してみてください。

于 2012-05-14T17:44:17.603 に答える
2

cdh4.3 を使用している場合、zookeeper のパスは /hbase/table94/ である必要があります。

于 2013-08-06T08:34:24.793 に答える
1

@Devin Bayer の回答を拡張するには、次を実行します。

delete /hbase/table/<name_of_zombie_table>

飼育係によって維持されているゾンビ テーブルを見つけた場合。この問題の詳細については、「HBase ゾンビ テーブル」をググってください。

于 2016-09-22T12:11:32.630 に答える
0

指定したテーブルを Zookeeper パスから削除するだけで十分です。たとえば、 zookeeper.znode.parentが hbase-site.xml でブロブするように構成されている場合は、zookeeperzkCli.shサーバー シェルで起動し、コマンドでそのディレクトリを削除する必要がありますrmr /blob/table/tsdb

于 2015-08-25T14:17:42.583 に答える
0

hbase-clean.sh --cleanZk

それはうまく機能し、十分に単純です。

于 2016-07-03T13:41:12.260 に答える
0

私は職場でこれらの問題に直面しています。通常、znode を削除して対応するテーブルを削除するか、HMaster と Hregionserver の両方で hbase を再起動して、hbck ステータスを OK にします。

于 2015-07-24T16:17:36.900 に答える