私の質問に興味を持っていただきありがとうございます。始める前に、私は Hadoop と HBase の初心者であることをお知らせしたいと思います。これまでのところ、Hadoop は非常に興味深いものであり、今後もさらに貢献したいと考えています。
主に HBase のパフォーマンスの向上に関心があります。そのために、1 つの hbase テーブルを作成し、5000 行 ( 「!」で区切られた値のみ) のデータをロードするためのピッグ スクリプトを hbase テーブルに記述し、後でこの h ベース テーブルを Hive テーブルにマップしました。現在、すべてが正常に機能しています...しかし、問題は、キーと値の両方を持つデータ(たとえば、key1 = 12!key2 = 13)をロードしたいということです。そのために、どのような解析ができますかそれに応じてそのキーと値のペアのデータを h ベース テーブルにロードすることを選択します。また、h ベース テーブルの行キーの重要性を教えてください。
そして、私は次のように豚のスクリプトを書いていました
A = LOAD '/BULK_ARK_DATA/' USING PigStorage( '!' ) AS(id: chararray,a: chararray,b: chararray,c: chararray); org.apache.pig.backend.hadoop.hbase.HBaseStorage ( 'AF:a AF:b AF:c'); を使用して 'hbase://bulk_ark' に A を格納します。
では、キー値データを hbase テーブルにロードする方法 ?????? あなたがこれを得るとすぐに私に応答してください.... :)