hadoop - HDFS、HBase、Hive に関するいくつかの疑問

Question

Hadoop エコシステムについていくつか疑問があります。概念をよく理解しようとする意欲。

score 2 · Accepted Answer

答えは次のとおりです。

通常、Hive は、構成されたファイルシステムディレクトリの下のテーブル名のディレクトリにデータを格納します。通常はの HDFS ディレクトリであり、のプロパティを/user/hive/warehouse介して調整できます。hive-site.xmlhive.metastore.warehouse.dir
Hive と HBase は、2 つの異なるテーブルストレージの概念です。前者には、レコードやランダムな読み取り/書き込みの概念がありません。それらの間の唯一の共通点は、Hive が HBase のサーバー/フォーマットに格納されたテーブルデータを読み取る必要があるコネクタです。
これについては、HBase リファレンスガイドで詳しく説明されています。最も簡単な方法は、hbase shell.
HDFS は、Unix や Windows のファイルシステムに似たプレーンなファイルシステム (分散のみ) であるため、保存するデータの種類は気にしません。後で消化するために使用できるリーダー/ライターロジックもあれば、必要なものは何でも保存できます。
Pig は、Pig スクリプトで HBase 行データにアクセスして表現できるように、そのコアの一部としてHBaseStorage組み込みのストレージアクセスメソッドを提供します。
(2) を参照してください。あなたが望まない限り、どちらも無関係なので、答えはイエスです。

1 に答える 1