私はhadoopとhbaseに非常に慣れていないので、見つけたすべてのチュートリアルで私をつまずかせるいくつかの概念的な質問があります。
私は、win7システムのubuntuVM内の単一ノードでhadoopとhbaseを実行しています。単一のhbaseテーブルにロードしたいcsvファイルがあります。
列は次のとおりです。loan_number、borrower_name、current_distribution_date、loan_amount
このcsvファイルをhbaseにロードするには、MapReduceジョブを作成する必要があることを知っています。次のチュートリアルでは、このMapReduceジョブを作成するために必要なJavaについて説明します。 http://salsahpc.indiana.edu/ScienceCloud/hbase_hands_on_1.htm
私が見逃しているのは:
これらのファイルはどこに保存し、どこでコンパイルしますか?Visual Studio12を実行しているWin7マシンでこれをコンパイルしてから、ubuntu vmに移動する必要がありますか?
私はこのSOの質問と回答を読みましたが、まだ基本が欠けていると思います:MapReduceを使用してCSVファイルをHbaseテーブルにロードする
これらの基本的なhadoop/hbaseロジスティクスをカバーするものは何も見つかりません。どんな助けでも大歓迎です。