10

Teradataに触れました。私は Hadoop に触れたことはありませんが、昨日から、hadoop についていくつかの調査を行っています。両方の説明からすると、それらはかなり互換性があるように見えますが、いくつかの論文では、それらが異なる目的に役立つと書かれています. しかし、私が見つけたのは漠然としたものだけです。私は混乱しています。

両方経験した人いますか?それらの深刻な違いは何ですか?

簡単な例: 何十億行もの生データを変換して DWH に整理する ETL を構築したいと考えています。次に、それらに対していくつかのリソースの高価な分析を行います。TD を使用する理由 なぜHadoop? またはなぜですか?

4

4 に答える 4

9

「MapReduce と並列 DBMS: 味方か敵か」というタイトルのこの記事は、各テクノロジが最適に機能する状況を説明するのに非常に適していると思います。一言で言えば、Hadoop は、非構造化データを格納し、並列変換を実行して入力データを「サニタイズ」するのに優れています。DBMS は、複雑なクエリを迅速に実行することに優れています。

于 2013-04-02T19:58:37.757 に答える
2

まず、Vanilla Apache Hadoop は 100% オープン ソースです。しかし、コンサルティングと共に商用サポートが必要な場合は、Cloudera、MapR、HortonWorks などの企業があります。

Hadoop は、バグを修正し、一貫して改善を行っているコミュニティの成長に支えられています。Hadoop ストレージ モデル HDFS は、大量のデータを処理できることが証明されているGoogle のGFSアーキテクチャに基づいています。さらにHadoopの解析モデルMap Reduceは、GoogleのMap Reduce Modelをベースにしています。

Hadoop は、Facebook、Yahoo、Twitter、EBay などのテック ジャイアントによって、大量のデータをリアルタイムに保存および分析するために使用されています。

あなたの質問については、ETL システムが表示されるこれらのスライドを読んでください。

では、なぜ Hadoop なのか?

  1. オープンソース
  2. 大量のデータに対する実証済みのストレージおよび分析モデル
  3. セットアップして実行するための最小ハードウェア要件。

わかりました なぜ TD なのですか?

  1. 商用サポート
于 2013-01-31T09:47:38.623 に答える