0

Hadoop では、巨大なテキスト ファイルや csv ファイルのデータにアクセスして処理する Map/Reduce アプリを簡単に作成できます。私の質問は、Hbase で同じことを実行してそのような巨大なファイルにアクセスできるか、または HBase に他の用途があるかということです。

Hbase は、リレーショナル データベースと同様にクエリを実行します。そのため、Hadoop のように巨大なテキストや csv ファイルにアクセスできない限り、HBase の利点を理解するのに苦労しています。

4

1 に答える 1

1

まず第一に、Hbase は単なるストアです。そしてストアは何にもアクセスしません。むしろ、ストアにアクセスしてデータを取得または配置します。他のデータストアと同様に、Hbase で行う作業は 1 つだけです。データを保存し、必要なときにいつでも利用できるようにします。MapReduce ジョブやシーケンシャル Java プログラムなどを記述して、データを Hbase に入れたり、そこからデータを取得したりできます。どちらの道を選ぶかは完全にあなた次第です。

質問の 2 番目の部分になりますが、Hbase は従来のリレーショナル データベースのようには機能しません。データの保存からデータへのアクセスまで、すべてがまったく異なります。Hbase を使用する利点は、非常に大量のデータを格納でき、ランダムな読み取り/書き込みアクセスができることです。データはどのようなタイプでもかまいません。テキスト、csv、tsv、バイナリなど。ただし、先に進む前に、Hbase が適切な選択であるかどうかをよく検討する必要があります。

HTH

于 2012-12-17T20:34:22.577 に答える