database - Hadoop と Teradata の違いは何ですか

Question

Teradataに触れました。私は Hadoop に触れたことはありませんが、昨日から、hadoop についていくつかの調査を行っています。両方の説明からすると、それらはかなり互換性があるように見えますが、いくつかの論文では、それらが異なる目的に役立つと書かれています. しかし、私が見つけたのは漠然としたものだけです。私は混乱しています。

両方経験した人いますか？それらの深刻な違いは何ですか？

簡単な例: 何十億行もの生データを変換して DWH に整理する ETL を構築したいと考えています。次に、それらに対していくつかのリソースの高価な分析を行います。TD を使用する理由なぜHadoop? またはなぜですか？

score 9 · Accepted Answer

「MapReduce と並列 DBMS: 味方か敵か」というタイトルのこの記事は、各テクノロジが最適に機能する状況を説明するのに非常に適していると思います。一言で言えば、Hadoop は、非構造化データを格納し、並列変換を実行して入力データを「サニタイズ」するのに優れています。DBMS は、複雑なクエリを迅速に実行することに優れています。

score 2 · Accepted Answer

まず、Vanilla Apache Hadoop は 100% オープンソースです。しかし、コンサルティングと共に商用サポートが必要な場合は、Cloudera、MapR、HortonWorks などの企業があります。

Hadoop は、バグを修正し、一貫して改善を行っているコミュニティの成長に支えられています。Hadoop ストレージモデル HDFS は、大量のデータを処理できることが証明されているGoogle のGFSアーキテクチャに基づいています。さらにHadoopの解析モデルMap Reduceは、GoogleのMap Reduce Modelをベースにしています。

Hadoop は、Facebook、Yahoo、Twitter、EBay などのテックジャイアントによって、大量のデータをリアルタイムに保存および分析するために使用されています。

あなたの質問については、ETL システムが表示されるこれらのスライドを読んでください。

では、なぜ Hadoop なのか?

オープンソース
大量のデータに対する実証済みのストレージおよび分析モデル
セットアップして実行するための最小ハードウェア要件。

わかりましたなぜ TD なのですか？

商用サポート

database - Hadoop と Teradata の違いは何ですか

4 に答える 4

Related

Reference