Hadoop 開発は初めてです。当社では、IBM BigInsights クラスターを使用しており、HBASE
プロジェクトに取り組んでいます。HDFS から HBASE にデータをロードする必要があります。
そのために、私は 3 つの方法に精通しています。
1. Load data from HDFS into HIVE table and insert into HBASE table.
2. Load data from HDFS into PIG table and insert into HBASE table.
3. Load data directly from HDFS and insert HBASE table (Java- MapReduce Code)
最近、できることを知りましたload data from BIG SQL table into HBASE table
。どうすればそれを行うことができるかについての適切なガイダンス/スクリプトを見つけることができません。誰かがサンプル スクリプトを手伝ってくれたら、本当に感謝しています。
結果に基づいて、データをロードするときにどちらが速いかを調べようとしていますHBASE
か?