データ ウェアハウスとは何か、ビッグ データとは何かを知っています。しかし、私はデータウェアハウス対ビッグデータと混同しています. 両方とも同じで名前が異なるか、または両方が異なります(概念的および物理的に)。
6 に答える
これが古いスレッドであることは知っていますが、昨年かそこらでいくつかの進展がありました. データ ウェアハウスを Hadoop と比較することは、リンゴとオレンジを比較するようなものです。データ ウェアハウスとは、高品質のクリーンで統合されたデータという概念です。データ ウェアハウスの必要性がすぐになくなるとは思いません。一方、Hadoop はテクノロジーです。大量のデータを処理するための分散コンピューティング フレームワークです。これまでのデータ ウェアハウスは、通常、リレーショナル データベースとデータ ウェアハウス アプライアンス上に構築されていました。ただし、ここ数年で RDBMS のさまざまな制限が明らかになりました (データ量の増加に直面してライセンス コストが爆発的に増加している、グラフや階層のクエリを実行したり、非構造化データ型を取り込んだりする目的に適合していないなど)。
すべての詳細に興味がある場合は、この件に関する一連の投稿を書きました。ビッグデータ時代のデータウェアハウジング。一時代の終わり?
Hadoop とデータ ウェアハウスの違いと、両者がどのように補完し合うかを説明する素晴らしいスライドがいくつかあります。
次の記事は、あなたの考えに非常に役立つと思います。
It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the “traditional” single database implementation of a data warehouse.
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses.
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments.
から: http://gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx