1

Hive は、MapReduce タイプのジョブを簡単に記述できるようにするための SQL に似たプログラミング言語 (Pig/Pig Latin の SQL に似たバージョン) だと思っていました。しかし、私は今それについて詳しく読んでいますが、実際には完全なデータ ウェアハウス インフラストラクチャであるようです。

これらの使用例の 1 つがより一般的ですか? つまり、主に提供するデータ ウェアハウス インフラストラクチャに使用されますか、それとも SQL に似たインターフェイスに使用されますか? それとも、有用性と重要性の両方の側面が等しいのでしょうか?

(私は、Hive のどの部分について学ぶことに集中すべきかを理解しようとしているので、質問しています。)

4

2 に答える 2

2

まさに私も昔はそう思っていました。Hive を約 1 か月使用してみたところ、これが優れた ETL ツールであることがわかりました。後でデータ ウェアハウスを作成するためのものです。

Hive は MDX とは比較になりません。Hive は非常に行ベースであり、SQL や MDX (BI ツールで一般的な多次元式言語) が得意とする複雑な操作の多くは許可されていません。

Hive を ETL ツールとして使用して、さまざまなフラット ファイル データ ソースを統合し、SQL ベースのデータ ウェアハウスにアップロードする必要があるデータの量を減らしています。

そのデータの半減期が数週間しかない場合、データベースのサイズを比較的管理しやすいサイズに保つことができ、後でいつでも Hive からレポートを再現できます。

于 2011-06-21T18:11:41.417 に答える
0

Hive は更新をサポートしていません。私たちの実装では、データ ウェアハウスにデータを入力するために直接 MapReduce ジョブを使用し、さらに処理するためのエクスポートを作成したり、リレーショナル データ ウェアハウスにインポートしたりするために Hive を使用しました。また、BI レポート ツールの仲介としても使用しました。

于 2011-06-21T18:45:13.357 に答える